Large Language Model (โมเดลภาษาขนาดใหญ่) คืออะไร?
เครือข่ายประสาทขนาดยักษ์ที่มีพารามิเตอร์หลายพันล้านตัวและมีความเชี่ยวชาญในการเข้าใจและสร้างภาษา
คำนิยาม
Large Language Model (LLM) หรือโมเดลภาษาขนาดใหญ่ คือเครือข่ายประสาทเทียมขนาดใหญ่มากที่มีพารามิเตอร์หลายพันล้านตัวและมีความเชี่ยวชาญอย่างยิ่งในการเข้าใจ สร้าง และโต้ตอบกับภาษาธรรมชาติ
วัตถุประสงค์
เพื่อเข้าใจความซับซ้อนของภาษามนุษย์และบรรลุประสิทธิภาพระดับมนุษย์ในงานที่เกี่ยวข้องกับภาษาต่าง ๆ
การทำงาน
ได้รับการฝึกอบรมด้วยชุดข้อมูลขนาดใหญ่เพื่อเรียนรู้รูปแบบ ไวยากรณ์ ความหมาย และบริบทของภาษา แล้วใช้ความรู้นี้ในการสร้างข้อความใหม่
ตัวอย่าง
โมเดลเช่น GPT-4, PaLM, Claude ที่สามารถเขียนบทความ สร้างโค้ด แปลภาษา และตอบคำถามที่ซับซ้อนได้
เกี่ยวข้อง
- GPT (เจเนอเรทีฟ พรี-เทรนด์ ทรานส์ฟอร์เมอร์)
- Transformer (ทรานส์ฟอร์เมอร์)
- Natural Language Processing (การประมวลผลภาษาธรรมชาติ)
- Parameters (พารามิเตอร์)
ต้องการเรียนรู้เพิ่มเติมหรือไม่?
หากคุณอยากทราบเพิ่มเติมเกี่ยวกับ Large Language Model (โมเดลภาษาขนาดใหญ่), ติดต่อฉันผ่าน X ฉันชอบแบ่งปันความคิด ตอบคำถาม และพูดคุยเกี่ยวกับความน่าสนใจในหัวข้อนี้ อย่าลังเลที่จะเข้ามาพูดคุยกันนะ แล้วเจอกัน!
GPT คืออะไร?
GPT (Generative Pre-trained Transformer) คือประเภทของเครือข่ายประสาทเทียมที...
Context Window คืออะไร?
Context Window คือปริมาณข้อความ (Token) สูงสุดที่โมเดลภาษา AI สามารถพิจารณา...
Anthropomorphization ใน AI คืออะไร?
Anthropomorphization ใน AI คือแนวโน้มของมนุษย์ที่จะให้คุณลักษณะ อารมณ์ เจตน...
Cognitive Bias ใน AI คืออะไร?
Cognitive Bias ใน AI หมายถึงรูปแบบความเบี่ยงเบนอย่างเป็นระบบจากความมีเหตุผล...
AI (ปัญญาประดิษฐ์) คืออะไร?
AI หรือปัญญาประดิษฐ์ (Artificial Intelligence) คือสาขาวิชาที่กว้างขวางในการ...