Sử dụng AI để tái tạo giọng nói cho bệnh nhân ung thư

Chia sẻ Facebook
20/08/2022 15:39:25

CoeFont, một công ty có trụ sở tại Tokyo (Nhật Bản) đang thu hút sự chú ý với dịch vụ độc đáo sử dụng trí tuệ nhân tạo (AI) để tái tạo giọng nói cho những người mất giọng do phẫu thuật ung thư.


Dịch vụ của CoeFont sử dụng AI để học cao độ, ngữ điệu của giọng nói cũng như tốc độ nói của người dùng trước khi phẫu thuật. Sau đó, hệ thống sẽ tái tạo thành một giọng nói tổng hợp, có thể đọc thành tiếng văn bản do người dùng nhập vào, với giọng nói giống như giọng gốc của bệnh nhân.

Chủ tịch CoeFont, Shogo Hayakawa, hiện là sinh viên năm thứ 3 của Học viện Công nghệ thuộc Đại học Tokyo, cho biết ban đầu công ty không có ý định phát triển dịch vụ này mà chỉ nhằm cung cấp cho những người tạo nội dung video đăng trên các trang web như YouTube, trong đó sử dụng AI độc các câu nói của các phát thanh viên, nghệ sĩ lồng tiếng. Tuy nhiên, sau khi bà Michiko Sakai, một bệnh nhân được chẩn đoán ung thư khí quản, đến gặp Hayakawa trước khi phẫu thuật, Hayakawa đã quyết định sử dụng dịch vụ này cho mục đích y tế.

Trong vòng 8 ngày trước khi phẫu thuật, bệnh nhân Sakai được yêu cầu đọc 700 câu để AI ghi lại giọng của bà. Sau phẫu thuật, bà Sakai cho biết: "Người đầu tiên tôi nói chuyện sau cuộc phẫu thuật là một y tá tại bệnh viện. Cô ấy rất ngạc nhiên khi nghe giọng nói của tôi giống như trước đây, điều đó khiến tôi rất vui". Chồng của bà Sakai cũng cho biết họ có thể trò truyện một cách tự nhiên và không có cảm giác xa lạ.

Với dịch vụ của CoeFont, sau khi người dùng nhập một câu văn bản trên điện thoại thông minh, hệ thống sẽ tự động đọc thành tiếng một cách nhịp nhàng với ngữ điệu giống của người dùng và người nghe khó nhận ra đây là một giọng nói được tái tạo.

Theo số liệu thống kê của một tổ chức đại diện cho những người bị mất giọng nói tại Tokyo, Nhật Bản có khoảng 20.000 đến 30.000 người bị mất giọng nói do ung thư. Masanori Matsuyama - người đứng đầu tổ chức này - đánh giá cao dịch vụ của CoeFont và bày tỏ hy vọng AI sẽ tiến bộ hơn nữa và tiến tới tái tạo được giọng nói bằng cách đọc chuyển động của miệng.

Chia sẻ Facebook