in AI

NVIDIA เปิดตัว AI ใหม่ชื่อ Fugatto สร้าง “เสียง” จากคำบรรยายที่ป้อน

โดย Nooknick Yanika 26/11/2024, 09:56 1.7K Views

NVIDIA เปิดตัว AI ตัวใหม่ ใช้เจนเสียงประกอบและปรับแต่งเสียงที่มีอยู่แล้วได้ ทำง่าย ๆ แค่ป้อนคำสั่ง อีกหนึ่ง AI ที่น่าสนใจของสายโปรดักชั่น

AI ของ NVIDIA ที่ชื่อ Fugatto สามารถสร้าง “เสียง” จากการใส่ prompt

NVIDIA ได้เปิดตัว Generative AI ตัวใหม่ ที่ถูกเรียกว่า “a Swiss Army knife for sound” หรือ มีดพับสวิสสำหรับการสร้างเสียงที่มีความสามารถหลายอย่าง โมเดลนี้ชื่อว่า Foundational Generative Audio Transformer Opus 1 หรือเรียกสั้น ๆ ว่า “Fugatto” ซึ่งสามารถรับคำสั่งจากข้อความ (Text Prompt) เพื่อสร้างเสียงใหม่หรือปรับแต่งไฟล์เพลง เสียงพูด และเสียงอื่น ๆ ที่มีอยู่ได้

โมเดลนี้ได้รับการพัฒนาโดยทีมนักวิจัย AI จากทั่วโลก ด้วยทีมนักพฒนาที่มาจากหลายภาษา ทำให้ AI ตัวนี้เข้าใจภาษาและสำเนียงต่าง ๆ ได้อย่างมีประสิทธิภาพ และหนึ่งในนักวิจัยเบื้องหลังโปรเจกต์นี้บอกว่า ทีมต้องการสร้างโมเดลที่เข้าใจและสร้างเสียงได้เหมือนมนุษย์

ตัวอย่างสถานการณ์การใช้งาน Fugatto ในโลกจริง

โปรดิวเซอร์เพลง สามารถใช้เทคโนโลยีนี้เพื่อสร้างต้นแบบของเพลงได้อย่างรวดเร็ว จากนั้นสามารถแก้ไขเพื่อทดลองสไตล์ เสียงพูด หรือเครื่องดนตรีต่าง ๆ
ผู้คนอาจนำไปใช้สร้างสื่อการเรียนรู้ด้านภาษาในเสียงที่ต้องการ
นักพัฒนาเกม อาจใช้สร้างเสียงที่หลากหลายจากไฟล์เสียงที่มีอยู่แล้ว เพื่อให้เข้ากับการเปลี่ยนแปลงในเกมที่ขึ้นอยู่กับการกระทำของผู้เล่น

หากมีการปรับแต่งเพิ่มเติม เช่น การสร้างเสียงพูดที่มีอารมณ์โกรธในสำเนียงเฉพาะ หรือเสียงนกร้องในขณะที่เกิดพายุฝน เสียงฝนตกหนักที่เคลื่อนผ่านพื้นที่ เจ้า AI ตัวนี้ก็สามารถทำงานในส่วนนี้ได้ด้วย

NVIDIA ยังไม่ได้ระบุว่าจะเปิดให้คนทั่วไปเข้าถึง Fugatto หรือไม่ โมเดลนี้ไม่ใช่เทคโนโลยี AI ตัวแรกที่สามารถสร้างเสียงจากข้อความได้ เพราะมีหลายเจ้าในตลาดทำโมเดล AI ในลักษณะนี้ออกมาแล้ว

ที่มา – Engadget

ความคิดเห็น - Like เพจ iPhoneMod.net