multimodal

Lance: โมเดล Multimodal 3B จาก ByteDance ที่รองรับ Any-to-Any ทั้งภาพและวิดีโอ

Lance คือโมเดล Multimodal ขนาดกะทัดรัด (3B parameters) จาก ByteDance Research ที่ออกแบบมาเพื่อรองรับงานแบบ Any-to-Any ซึ่งรวมถึงการทำความเข้าใจ (Understanding), การสร้าง (Generation) และการแก้ไข (Editing) ทั้งในรูปแบบภาพและวิดีโอไว้ในเฟรมเวิร์กเดียวสำหรับนักพัฒนาและวิศวกร AI ที่กำลังมองหาโมเดลที่มีประสิทธิภาพสูงในขนาดที่จัดการได้ง่าย…

2 weeks ago

ทำความรู้จัก NVIDIA Nemotron 3 Nano Omni: โมเดล AI Multimodal อัจฉริยะ รองรับเอกสาร เสียง และวิดีโอ

NVIDIA ได้เปิดตัว Nemotron 3 Nano Omni ซึ่งเป็นก้าวสำคัญของโมเดล AI แบบ Multimodal ที่ออกแบบมาเพื่อการทำความเข้าใจข้อมูลที่ซับซ้อนและหลากหลายรูปแบบ ไม่ว่าจะเป็นเอกสารยาวๆ เสียง หรือวิดีโอ บทความนี้จะพาคุณไปทำความรู้จักกับความสามารถของโมเดลนี้ว่าทำไมถึงเป็นตัวเลือกที่น่าสนใจสำหรับนักพัฒนาและองค์กรที่ต้องการประสิทธิภาพสูงสุดในการประมวลผลข้อมูลสารบัญทำความรู้จักกับ NVIDIA Nemotron 3 Nano Omni5…

4 weeks ago