วันนี้ไปเจอคลิปร้องเพลงที่สร้างเสียงร้องด้วย AI แบบเพราะมากๆ ฟังบางช่วงเหมือนคนร้องเลย แถมมีวิธีใช้งานโปรแกรมอธิบายด้วย ก็เลยขอหยิบมาแนะนำให้รู้จักกันครับ
Kiritorisen ร้องด้วย AI Kiritan
ฟังคลิปแล้วคงเข้าใจกันว่าอารมณ์ น้ำเสียงมีความเป็นธรรมชาติมาก เทียบเท่า Vocaloid ช่วงหลังๆ ที่มีคนบรรจงใส่คีย์ ใส่อารมณ์ให้เลย ที่น่าทึ่งมากคือ เสียงร้องนี้เกิดจากโปรแกรมที่ใช้ AI สร้างเสียงร้องให้ เพียงแค่ป้อนโน้ตเพลง midi และเนื้อเพลงให้เท่านั้น!
โปรแกรมนั้นคือ NEUTRINO (เว็บไซต์ https://n3utrino.work/) โปรแกรมสังเคราะห์เสียงร้องเพลง มีต้นเสียงมาจากโปรแกรมสังเคราะห์เสียง VOICEROID เลือกตัวละครผู้ให้เสียงได้สองคนคือ Tohoku Kiritan (東北きりたん) และ Youko (謡子)
NEUTRINO - NEURAL SINGING SYNTHESIZER
วิธีใช้โปรแกรม NEUTRINO สามารถอ่านได้จากบทความภาษาญี่ปุ่นข้างล่างนี้
AIシンガーがとうとう我が手に……!! 新歌声合成ソフト「NEUTRINO」を使い倒した
หลังโหลดโปรแกรมมาแล้ว สิ่งที่ต้องป้อนให้คือ
- โน้ตเพลงเมโลดี้ และเนื้อร้อง ในฟอร์แมต .musicxml
อย่างเดียวเท่านั้น!! แล้วโปรแกรมก็จะสังเคราะห์เสียง ออกมาเป็นไฟล์เสียงร้อง .wav ให้นำไป mix ต่อในโปรแกรมทำเพลง DAW ได้เลย สุดยอด…
อนึ่ง ตอนนี้โปรแกรมรองรับการทำงานบน Windows เท่านั้น และห้ามใช้เสียงที่สร้างขึ้นเพื่อการค้าทุกกรณี
ตัวอย่างเสียง
sample1_syn.wav เสียงจากตัวอย่าง
เสียงนี้สร้างจากโน้ตเพลงตัวอย่างที่ติดมากับโปรแกรมโดยไม่ได้ตัดแต่งใดๆ ทั้งสิ้น เสียงร้องเป็นธรรมชาติมากเลย
วิธีทดลองใช้ NEUTRINO ขั้นต้น
อธิบายวิธีใช้ NEUTRINO ขั้นต้นเท่าที่ผมลองทำตามเว็บข้างบนนะครับ
- โหลดโปรแกรมแล้วแตกไฟล์
2. แก้ไขไฟล์ Run.bat ด้วย text editor อะไรก็ได้ (แนะนำ Notepad++)
BASENAME=sample1
เปลี่ยนเป็นชื่อไฟล์.musicxml
ที่เราเตรียมModelDir=KIRITAN
เปลี่ยนเป็นYOKO
เพื่อใช้เสียงอีกตัวละครได้
ไฟล์ .musicxml
วางไว้ในโฟลเดอร์ score/musicxml
3. เปิดไฟล์ Run.bat รอสักครู่ให้โปรแกรมประมวลผล (ใช้เวลา 3-4 เท่าของความยาวเนื้อเพลง) แล้วเข้าไปดูไฟล์เพลงได้ที่โฟลเดอร์ output
วิธีเตรียมไฟล์ .musicxml
ไฟล์โน้ตและเพลง สำหรับคนที่ทำเพลงเองคงทำเป็นกัน ผมเคยหัดนิดๆ หน่อยไม่สามารถลงรายละเอียดได้ ขั้นตอนคร่าวๆ คือ
- โหลดโปรแกรมแก้เนื้อเพลง Musescore
- คีย์โน้ตเพลงเอง หรือโหลด midi เพลงที่อยากเล่นมาเปิด ลบ track อื่นที่ไม่ใช่เมโลดี้ออกให้หมด
- ใส่โน้ตเพลงภาษาญี่ปุ่นลงไป
- Export เป็นไฟล์
.musicxml
ตัวอย่างโน้ตเพลง sample1 ที่ติดมากับโปรแกรม
ข้อควรระวัง
- เนื้อเพลงป้อนได้เฉพาะ Hiragana/Katakana เท่านั้น ไม่งั้นอ่านไม่ออก
- โปรแกรมมีการจำกัดความยาวและความซับซ้อนของโน้ตเพลง ถ้าตอนรันโปรแกรมขึ้น [WARN] มา ให้ลองตัดลดความยาวเพลงลงดู
สรุป
NEUTRINO เป็นเทคโนโลยีที่น่าทึ่งมาก เราเข้าใกล้ยุคที่ใช้ AI สร้างสรรค์ผลงานเพลงได้โดยง่ายดายขนาดนี้แล้ว แต่นี่ก็ไม่ได้หมายความว่าใครก็สามารถสร้างเพลงเพราะได้ เพราะสุดท้าย ข้อมูลที่ AI สร้างจะดีได้ก็ต่อเมื่อเราป้อนข้อมูลที่ดีเข้าไปเท่านั้น ข้อมูลในที่นี้คือเนื้อและโน้ตเพลงที่ผ่านการบรรจงเรียบเรียงมา คนที่ไม่มีความรู้ด้านนี้ก็คงไม่สามารถใช้โปรแกรมนี้ได้คล่องอยู่ดี
ในตัวอย่างเพลงบนยูทูปและ sample เสียงร้องเพราะมาก ไม่มีสะดุด แต่พอผมลองป้อนโน้ต midi เพลงที่แกะเองถูกๆ ผิดๆ เสียงที่ออกมาคือโหยหวนมาก ต้องมีการปรับแต่งคีย์ให้เข้ากับที่ AI ร้องได้ และเลือกแนวเพลงที่ AI ถนัดด้วย ผมเป็นแค่คนฟังธรรมดาไม่มีความรู้ส่วนนี้ จึงไม่สามารถใช้งานมันได้เลย พูดได้ว่านี่เป็นเครื่องทุ่นแรงชั้นยอดสำหรับนักแต่งเพลง อยากจะรู้เลยว่านักพัฒนาจะพัฒนามันต่อไปได้ถึงขนาดไหน โลกนี้ช่างน่าตื่นเต้นจริงๆ!
ปล. บทความน่าอ่าน กว่าจะมาเป็น AI ตัวนี้ได้ ต้องอาศัยความร่วมมือของกฎหมายญี่ปุ่นที่อนุญาตให้ใช้ข้อมูลเสียงมาเทรน AI, ต้นเสียง, ฐานข้อมูลเสียง และเทคโนโลยี ปรบมือให้กับความพยายามของทุกๆ ฝ่ายครับ