NVIDIA เปิดตัว AI ตัวใหม่ ใช้เจนเสียงประกอบและปรับแต่งเสียงที่มีอยู่แล้วได้ ทำง่าย ๆ แค่ป้อนคำสั่ง อีกหนึ่ง AI ที่น่าสนใจของสายโปรดักชั่น
AI ของ NVIDIA ที่ชื่อ Fugatto สามารถสร้าง “เสียง” จากการใส่ prompt
NVIDIA ได้เปิดตัว Generative AI ตัวใหม่ ที่ถูกเรียกว่า “a Swiss Army knife for sound” หรือ มีดพับสวิสสำหรับการสร้างเสียงที่มีความสามารถหลายอย่าง โมเดลนี้ชื่อว่า Foundational Generative Audio Transformer Opus 1 หรือเรียกสั้น ๆ ว่า “Fugatto” ซึ่งสามารถรับคำสั่งจากข้อความ (Text Prompt) เพื่อสร้างเสียงใหม่หรือปรับแต่งไฟล์เพลง เสียงพูด และเสียงอื่น ๆ ที่มีอยู่ได้
โมเดลนี้ได้รับการพัฒนาโดยทีมนักวิจัย AI จากทั่วโลก ด้วยทีมนักพฒนาที่มาจากหลายภาษา ทำให้ AI ตัวนี้เข้าใจภาษาและสำเนียงต่าง ๆ ได้อย่างมีประสิทธิภาพ และหนึ่งในนักวิจัยเบื้องหลังโปรเจกต์นี้บอกว่า ทีมต้องการสร้างโมเดลที่เข้าใจและสร้างเสียงได้เหมือนมนุษย์
ตัวอย่างสถานการณ์การใช้งาน Fugatto ในโลกจริง
- โปรดิวเซอร์เพลง สามารถใช้เทคโนโลยีนี้เพื่อสร้างต้นแบบของเพลงได้อย่างรวดเร็ว จากนั้นสามารถแก้ไขเพื่อทดลองสไตล์ เสียงพูด หรือเครื่องดนตรีต่าง ๆ
- ผู้คนอาจนำไปใช้สร้างสื่อการเรียนรู้ด้านภาษาในเสียงที่ต้องการ
- นักพัฒนาเกม อาจใช้สร้างเสียงที่หลากหลายจากไฟล์เสียงที่มีอยู่แล้ว เพื่อให้เข้ากับการเปลี่ยนแปลงในเกมที่ขึ้นอยู่กับการกระทำของผู้เล่น
หากมีการปรับแต่งเพิ่มเติม เช่น การสร้างเสียงพูดที่มีอารมณ์โกรธในสำเนียงเฉพาะ หรือเสียงนกร้องในขณะที่เกิดพายุฝน เสียงฝนตกหนักที่เคลื่อนผ่านพื้นที่ เจ้า AI ตัวนี้ก็สามารถทำงานในส่วนนี้ได้ด้วย
NVIDIA ยังไม่ได้ระบุว่าจะเปิดให้คนทั่วไปเข้าถึง Fugatto หรือไม่ โมเดลนี้ไม่ใช่เทคโนโลยี AI ตัวแรกที่สามารถสร้างเสียงจากข้อความได้ เพราะมีหลายเจ้าในตลาดทำโมเดล AI ในลักษณะนี้ออกมาแล้ว
ที่มา – Engadget