صداگذاری با AI
هفته گذشته، شرکت اُپنایآی (OpenAI) یک الگوی هوش مصنوعی جدید به نام سورا (Sora) منتشر کرد که میتواند کلیپهای ویدئویی با وضوح بالا از پیامهای متنی تولید کند. اما همه آنها اساساً فیلمهای صامت بودند. اکنون شرکت ایلوِنلبز (ElevenLabs) صدای پسزمینه را به فیلمهای ساختهشده از طریق سورا اضافه کرده است.
به گزارش ایسنا، استارتآپ شبیهسازی صدای هوش مصنوعی ایلونلبز از سوی پیوتر دابکوفسکی، مهندس پیشین یادگیری ماشینی گوگل و متی استانیسزوسکی استراتژیست سابق در سال ۲۰۲۲ تاسیس شد و از آن زمان نرمافزار تبدیل متن به گفتار و ابزار دوبله هوش مصنوعی را توسعه داده است که بهطور خودکار گفتار در یک فیلم را به بیش از ۲۰ زبان که لحن و سبک صدای اصلی را حفظ میکنند، تبدیل میکند.
اکنون این شرکت روی چیز جدیدی کار میکند، که طبق گزارشها میتواند صداهایی را برای همراهی با فیلمهای ویدئویی بیصدا بر اساس توضیحات یک صحنه ارائهشده از سوی کاربر ایجاد کند. ایلونلبز برای نشان دادن مهارت خود آن را روی برخی از محتواهای تولیدشده از طریق سورا منتشر کرده است.
این شرکت توضیح میدهد: ما از پیامهای متنی مانند «برخورد امواج»، «صدای برخورد فلزات»، «صدای پرندگان» و «موتور ماشین مسابقهای» برای تولید صدا استفاده کردیم که روی برخی از کلیپهای مورد علاقهمان از اعلان سورا قرار دادیم.