Large Language Model (โมเดลภาษาขนาดใหญ่) คืออะไร? Definition & examples

คำนิยาม

Large Language Model (LLM) หรือโมเดลภาษาขนาดใหญ่ คือเครือข่ายประสาทเทียมขนาดใหญ่มากที่มีพารามิเตอร์หลายพันล้านตัวและมีความเชี่ยวชาญอย่างยิ่งในการเข้าใจ สร้าง และโต้ตอบกับภาษาธรรมชาติ

วัตถุประสงค์

เพื่อเข้าใจความซับซ้อนของภาษามนุษย์และบรรลุประสิทธิภาพระดับมนุษย์ในงานที่เกี่ยวข้องกับภาษาต่าง ๆ

การทำงาน

ได้รับการฝึกอบรมด้วยชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้รูปแบบ ไวยากรณ์ ความหมาย และบริบทของภาษา แล้วใช้ความรู้นี้ในการสร้างข้อความใหม่

ตัวอย่าง

โมเดลเช่น GPT-4, PaLM, Claude ที่สามารถเขียนบทความ สร้างโค้ด แปลภาษา และตอบคำถามที่ซับซ้อนได้

เกี่ยวข้อง

GPT (เจเนอเรทีฟ พรี-เทรนด์ ทรานส์ฟอร์เมอร์)
Transformer (ทรานส์ฟอร์เมอร์)
Natural Language Processing (การประมวลผลภาษาธรรมชาติ)
Parameters (พารามิเตอร์)

ai nlp

🍄

ต้องการเรียนรู้เพิ่มเติมหรือไม่?

หากคุณอยากเจาะลึกเกี่ยวกับ Large Language Model (โมเดลภาษาขนาดใหญ่) เพิ่มเติม หรืออยากนำการฝึกอบรมแบบนี้มาสู่ทีมของคุณ มาพูดคุยกัน ฉันช่วยให้ทีมต่าง ๆ เข้าใจและนำแนวคิดเหล่านี้ไปปรับใช้ได้ ฉันยินดีอย่างยิ่งที่จะได้รับการติดต่อจากคุณ!

GPT คืออะไร?

GPT (Generative Pre-trained Transformer) คือประเภทของเครือข่ายประสาทเทียมที...

Anthropomorphization ใน AI คืออะไร?

Anthropomorphization ใน AI คือแนวโน้มของมนุษย์ที่จะให้คุณลักษณะ อารมณ์ เจตน...

Transformer (ทรานส์ฟอร์เมอร์) คืออะไร?

Transformer คือประเภทของสถาปัตยกรรมเครือข่ายประสาทที่ใช้ "attention mechani...

Machine Learning (การเรียนรู้ของเครื่อง) คืออะไร?

Machine Learning หรือการเรียนรู้ของเครื่อง คือสาขาของ AI ที่ทำให้ระบบคอมพิว...

Neural Network (เครือข่ายประสาท) คืออะไร?

Neural Network หรือเครือข่ายประสาท คือโมเดลคอมพิวเตอร์ที่เลียนแบบการทำงานขอ...