سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2658
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
تشکیل حکومت شیعی

تشکیل حکومت شیعی

عصر صفوی

Draw A Stickman EPIC

Draw A Stickman EPIC

مداد همه‌کاره و آدمک‌ها

CyberLink PhotoDirector Ultra 2026 17.0.1202.0

CyberLink PhotoDirector Ultra 2026 17.0.1202.0

ویرایش عکس

Hegemony Rome - The Rise of Caesar

Hegemony Rome - The Rise of Caesar

سلطه‌ی روم - قیام ژولیوس سزار

The Adventures of Rocky and Bullwinkle

The Adventures of Rocky and Bullwinkle

انیمیشن سینمایی

Short story about spacious laboratory

Short story about spacious laboratory

شیمی پیشرفته

SteamWorld Dig v1.10

SteamWorld Dig v1.10

حفاری

Boson NetSim for CCNP 9.9.5231.17264 + Network Simulator 11.7.6487.20622

Boson NetSim for CCNP 9.9.5231.17264 + Network Simulator 11.7.6487.20622

یکی از بهترین نرم افزارهای شبیه سازی شبکه

سخنرانی های آیت الله شهید مطهری بخش ششم

سخنرانی های آیت الله شهید مطهری بخش ششم

Ostad Motahari

7 جلسه فرازهایی از وصیتنامه امام علی علیه السلام، آثار نماز  از حجت الاسلام والمسلمین علیرضا حدائق

7 جلسه فرازهایی از وصیتنامه امام علی علیه السلام، آثار نماز از حجت الاسلام والمسلمین علیرضا حدائق

حاج آقا علیرضا حدائق با موضوع شرح و تفسیر دعای مکارم الاخلاق

GO Launcher HD 1.19 for Android +2.2

GO Launcher HD 1.19 for Android +2.2

لانچر معروف و قدرتمند برای تبلت ها

استراتژی سرمایه گذاری در سطح کسب و کار

استراتژی سرمایه گذاری در سطح کسب و کار

دیدگاه هایی در مورد آینده جهان

Mo+ 2.3.7 for Android +2.3

Mo+ 2.3.7 for Android +2.3

تماس و پیام رایگان اینترنتی

KeePass Password Safe 2.60

KeePass Password Safe 2.60

مدیریت پسورد

فیلم مقاومت گلکسی اس 8 در مقابل چاقو و چکش

فیلم مقاومت گلکسی اس 8 در مقابل چاقو و چکش

فیلم مقاومت galaxy s8 پلاس

مستند قاسم

مستند قاسم

فیلم مستند سردار سلیمانی

بهترین های ویندوز 1

بهترین های ویندوز 1

نرم افزارهای ویندوز

ssLauncher the Original 1.14.18 for Android +2.2

ssLauncher the Original 1.14.18 for Android +2.2

لانچر زیبا با نمایی متفاوت

Alekhine's Gun with Update v1.02

Alekhine's Gun with Update v1.02

تفنگ آلخین

Omni Swipe 2.46 mod for Android +4.0

Omni Swipe 2.46 mod for Android +4.0

ساخت میانبر برنامه ها

OsmAnd+ Full Maps & GPS Offline 5.2.11 for Android +8.0

OsmAnd+ Full Maps & GPS Offline 5.2.11 for Android +8.0

نقشه ی اوسم اند

Rainbow Mosaics - Christmas Lights

Rainbow Mosaics - Christmas Lights

موزاییک‌های رنگین کمان - چراغ‌های کریسمس

مجموعهٔ منحصربه‌فرد ۱۰۰ موسیقی بسیار زیبای پخش‌شده از صدا و سیمای ایران

مجموعهٔ منحصربه‌فرد ۱۰۰ موسیقی بسیار زیبای پخش‌شده از صدا و سیمای ایران

آهنگ‌های صدا و سیما

Waveform

Waveform

شکل موج

This Land Is My Land Founders Edition v18918 MULTi12

This Land Is My Land Founders Edition v18918 MULTi12

اکشن برای کامپیوتر

۶۰ تست هوش تصویری

۶۰ تست هوش تصویری

هوش خود را بسنجید

Reallusion Character Creator 5.02.0923.1 + Resource Pack

Reallusion Character Creator 5.02.0923.1 + Resource Pack

طراحی و مدلسازی کاراکترهای سه بعدی

خودآموز ویکی پدیا

خودآموز ویکی پدیا

آموزش ویکی پدیا

اهمیت حضور در صحنه انقلاب و انتخابات از حجت الاسلام والمسلمین محمدتقی فلسفی

اهمیت حضور در صحنه انقلاب و انتخابات از حجت الاسلام والمسلمین محمدتقی فلسفی

حاج آقا محمدتقی فلسفی با موضوع اهمیت حضور در صحنه انقلاب و انتخابات

یوسف زهرا سلام الله علیها ( نماهنگ برای امام زمان عجل الله تعالی فرجه الشریف ) - بخش دوم

یوسف زهرا سلام الله علیها ( نماهنگ برای امام زمان عجل الله تعالی فرجه الشریف ) - بخش دوم

نماهنگ برای امام زمان - یوسف زهرا (سلام الله علیها) - 2

Udemy - Blockchain and Bitcoin Fundamentals

Udemy - Blockchain and Bitcoin Fundamentals

آموزش بلاکچین و بیت کوین

Pluralsight - iOS7 Fundamentals

Pluralsight - iOS7 Fundamentals

فیلم آموزش مهارت‌های بنیادی iOS7

Lynda - Writing Business Reports

Lynda - Writing Business Reports

فیلم آموزش اصول نوشتن و تدوین گزارش‌های تجاری

آموزش Microsoft Office Word 2013

آموزش Microsoft Office Word 2013

آموزش Word 2013

Halo: Spartan Assault

Halo: Spartan Assault

هاله - حمله اسپارتان

Tilt Racing 1.4 for Android

Tilt Racing 1.4 for Android

بازی ماشین سواری

The Office Quest

The Office Quest

فکری برای کامپیوتر

Police Tactics - Imperio

Police Tactics - Imperio

تاکتیک های پلیس

بررسی تفسیری آیات سوره نور

بررسی تفسیری آیات سوره نور

تفسیر قرآن کریم

مکیال المکارم فی فوائد الدعاء للقائم

مکیال المکارم فی فوائد الدعاء للقائم

عقیده مهدویت و موضوع امام زمان (عج)

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!