หากคุณกำลังมองหาโซลูชันสำหรับการสร้าง Avatar ที่สมจริงและสามารถโต้ตอบได้แบบเรียลไทม์ AVTR-1 คือโปรเจกต์โอเพนซอร์สบน GitHub ที่น่าจับตามองอย่างยิ่ง โดย AVTR-1 เป็นโมเดลแบบ Autoregressive ที่ใช้เทคนิค Flow Matching ในการประมวลผล ช่วยให้ Avatar สามารถลิปซิงค์คำพูดและแสดงท่าทางตอบสนอง (Active Listening)…
ในโลกของ Generative AI ที่พัฒนาไปอย่างรวดเร็ว การสร้างวิดีโอคุณภาพสูงไม่ใช่เรื่องไกลตัวอีกต่อไป ล่าสุด NVIDIA ได้เปิดตัว SANA-WM ซึ่งเป็นโมเดลจำลองโลก (World Model) ที่มีความสามารถในการสร้างวิดีโอความละเอียด 720p ที่มีความยาวระดับนาที โดยผู้ใช้สามารถควบคุมการเคลื่อนไหวของกล้องได้ บทความนี้จะพาคุณไปเจาะลึกว่าเทคโนโลยีนี้คืออะไร และทำไมมันถึงเป็นก้าวสำคัญของวงการวิดีโอ AI สรุปสั้นๆ…