تاریخ انتشار:

صداگذاری با AI

هفته گذشته، شرکت اُپن‌ای‌آی (OpenAI) یک الگوی هوش مصنوعی جدید به نام سورا (Sora) منتشر کرد که می‌تواند کلیپ‌های ویدئویی با وضوح بالا از پیام‌های متنی تولید کند. اما همه آنها اساساً فیلم‌های صامت بودند. اکنون شرکت ایلوِن‌لبز (ElevenLabs) صدای پس‌زمینه را به فیلم‌های ساخته‌شده از طریق سورا اضافه کرده است.

به گزارش ایسنا، استارت‌آپ شبیه‌سازی صدای هوش مصنوعی ایلون‌لبز از سوی پیوتر دابکوفسکی، مهندس پیشین یادگیری ماشینی گوگل و متی استانیسزوسکی استراتژیست سابق در سال ۲۰۲۲ تاسیس شد و از آن زمان نرم‌افزار تبدیل متن به گفتار و ابزار دوبله هوش مصنوعی را توسعه داده است که به‌طور خودکار گفتار در یک فیلم را به بیش از ۲۰ زبان که لحن و سبک صدای اصلی را حفظ می‌کنند، تبدیل می‌کند.

اکنون این شرکت روی چیز جدیدی کار می‌کند، که طبق گزارش‌ها می‌تواند صداهایی را برای همراهی با فیلم‌های ویدئویی بی‌صدا بر اساس توضیحات یک صحنه ارائه‌شده از سوی کاربر ایجاد کند. ایلون‌لبز برای نشان دادن مهارت خود آن را روی برخی از محتواهای تولیدشده از طریق سورا منتشر کرده است.

این شرکت توضیح می‌دهد: ما از پیام‌های متنی مانند «برخورد امواج»، «صدای برخورد فلزات»، «صدای پرندگان» و «موتور ماشین مسابقه‌ای» برای تولید صدا استفاده کردیم که روی برخی از کلیپ‌های مورد علاقه‌مان از اعلان سورا قرار دادیم.

صداگذاری با AI

دراین پرونده بخوانید ...

پل اپل

کلاهبرداری‌های آیفونی

پربیننده ترین اخبار این شماره

پل اپل

کلاهبرداری‌های آیفونی

صداگذاری با AI

پربیننده ترین اخبار تمام شماره ها

اینجا تهران است، قسمت بازار اسلحه

مارکسیسم چیست؟

حق اولاد و کمک عائله مندی چیست؟ (شرایط برای کارگران)

ساقیانِ تلخ‌کامی

ویژگی‌های ماموران اطلاعات در نظام جمهوری اسلامی

بهترین شرکت بازرسی در ایران

رقابت بر سر کیفیت

دوران دستکاری کنتورها

قوت، ضعف، فرصت، تهدید

فارغ التحصیلان موفق دانشکده اقتصاد صنعتی شریف

احمقانه‌های مائو

سواد به‌معنای توانایی درک دنیاست

هزینه عینک تأمین اجتماعی: نحوه ثبت نام و دریافت

جهش آلمان پس از جنگ جهانی دوم چگونه شروع شد؟

آموزش پولشویی

سکس، مواد مخدر و بیت‌کوین

قانون سقف ارزی

دیروز و فرداهای قطعنامه 598

داستان ۵۳ نفر

طرح توجیهی تولید بریکت یا زغال فشرده