سافت گذر دانشنامه نرم افزار - دانلود رایگان نرم افزار

همه دسته بندی ها

منو
آیکون جستجو در سایت سافت گذر
اطلاعیه های مهم سایت اطلاعیه های مهم سایت
💐 میلاد زینت پدر حضرت زینب سلام الله علیها مبارک باد 💐
 
 
  1. جهت رفع مشکل باز شدن سایت به دلیل بلاک توسط  نود 32 این ویدیو یا این ویدیو(ورژن 9 به بالا) یا راهنمای تصویری را مشاهده کنید
  2. اکانت های بروزرسانی نود32 با قیمت های مناسب به صورت یک ، سه ، شش و دوازده ماهه از اینجا قابل خرید می باشد.

نرم افزار های پرکاربرد

ثبت نام | ورود

هوش مصنوعی

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

در ماه‌های اخیر، OpenAI چندین ابزار جدید از جمله Operator، Deep Research، Computer-Using Agents و Responses API را منتشر کرده که بر روی عامل‌های متنی متمرکز بوده‌اند. امروز، OpenAI مدل‌های جدید تبدیل گفتار به متن و متن به گفتار را در API خود اعلام کرد که به توسعه‌دهندگان امکان می‌دهد عامل‌های صوتی قدرتمندتر، قابل شخصی‌سازی‌تر و بیانگرتر از همیشه بسازند.

 

تغییرات صوتی OpenAI: معرفی نسل جدید مدل‌های هوش مصنوعی صدا

 

مدل‌های جدید تبدیل گفتار به متن OpenAI، gpt-4o-transcribe و gpt-4o-mini-transcribe، بهبودهای قابل توجهی در نرخ خطای کلمات، تشخیص زبان و دقت در مقایسه با مدل‌های Whisper موجود OpenAI ارائه می‌دهند. این پیشرفت‌ها از طریق یادگیری تقویتی و آموزش میانی گسترده با استفاده از مجموعه داده‌های صوتی متنوع و با کیفیت بالا به دست آمده است.

OpenAI ادعا می‌کند که این مدل‌های صوتی جدید می‌توانند ظرافت‌های گفتار را بهتر درک کنند، تشخیص‌های نادرست را کاهش دهند و قابلیت اطمینان رونویسی را حتی زمانی که صدای ورودی شامل لهجه‌ها، محیط‌های پر سر و صدا و سرعت‌های مختلف گفتار است، بهبود بخشند.

gpt-4o-mini-tts جدیدترین مدل تبدیل متن به گفتار است که قابلیت هدایت بهبود یافته‌ای را ارائه می‌دهد. توسعه‌دهندگان اکنون می‌توانند به مدل دستور دهند که چگونه محتوای متن را تلفظ کند. با این حال، فعلاً مدل تبدیل متن به گفتار به صداهای مصنوعی از پیش تعیین شده محدود است.

هزینه‌های مدل‌ها به شرح زیر است: مدل gpt-4o-transcribe: ۶ دلار برای هر میلیون توکن صوتی ورودی، ۲.۵۰ دلار برای هر میلیون توکن متنی ورودی و ۱۰ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-transcribe: ۳ دلار برای هر میلیون توکن صوتی ورودی، ۱.۲۵ دلار برای هر میلیون توکن متنی ورودی و ۵ دلار برای هر میلیون توکن متنی خروجی مدل gpt-4o-mini-tts: ۰.۶۰ دلار برای هر میلیون توکن متنی ورودی و ۱۲ دلار برای هر میلیون توکن صوتی خروجی

 

این هزینه‌ها به صورت دقیقه‌ای به شرح زیر محاسبه می‌شود:

  • gpt-4o-transcribe: حدود ۰.۶ سنت در دقیقه
  • gpt-4o-mini-transcribe: حدود ۰.۳ سنت در دقیقه
  • gpt-4o-mini-tts: حدود ۱.۵ سنت در دقیقه

تیم OpenAI درباره این مدل‌های صوتی جدید نوشت: “در آینده، ما قصد داریم به سرمایه‌گذاری در بهبود هوشمندی و دقت مدل‌های صوتی خود ادامه دهیم و راه‌هایی را برای اجازه دادن به توسعه‌دهندگان برای آوردن صداهای سفارشی خود جهت ساخت تجربیات شخصی‌سازی شده‌تر، به روش‌هایی که با استانداردهای ایمنی ما مطابقت دارند، بررسی کنیم.”

این مدل‌های صوتی جدید اکنون از طریق APIها برای همه توسعه‌دهندگان در دسترس هستند. OpenAI همچنین یک ادغام با Agents SDK را اعلام کرد که به توسعه‌دهندگان امکان می‌دهد به راحتی عامل‌های صوتی بسازند. برای تجربیات گفتار به گفتار با تأخیر کم، OpenAI استفاده از Realtime API را توصیه می‌کند.

نظرتان را ثبت کنید کد خبر: 52463 گروه خبری: هوش مصنوعی منبع خبر: سافت گذر تاریخ خبر: 1404/01/03 تعداد مشاهده: 2655
اخبار مرتبط با این خبر
نظر های کاربران
سرور آپدیت نود 32
پیشنهاد سافت گذر
iFont 5.9.8.8 for Android +2.3

iFont 5.9.8.8 for Android +2.3

فونت

Krita Studio 5.2.13

Krita Studio 5.2.13

نقاشی دیجیتال

Hill Racing 3D: Uphill Rush 1.06 for Android +2.3

Hill Racing 3D: Uphill Rush 1.06 for Android +2.3

مسابقه کامیون هیل

ABBYY FineReader Corporate 16.0.14.7295

ABBYY FineReader Corporate 16.0.14.7295

ابی فاین ریدر

Windows Server 2008 R2 SP1 November 2022 / MSDN VL

Windows Server 2008 R2 SP1 November 2022 / MSDN VL

ویندوز سرور 2008 سرویس پک 1

آشنایی با تحلیل آماری

آشنایی با تحلیل آماری

نرم افزار آماری spss

Journey Into the Beyond Documentary

Journey Into the Beyond Documentary

مستند سفر به ماورا

عاداتی که افراد باهوش از آن بهره می‌برند

عاداتی که افراد باهوش از آن بهره می‌برند

هوش هیجانی

سخنرانی استاد رفیعی با موضوع شرح حکمت های نهج البلاغه

سخنرانی استاد رفیعی با موضوع شرح حکمت های نهج البلاغه

شرح نهج البلاغه

مجله تخصصی برای علاقه مندان به اخبار و تحلیل های مالی و تجاری در بورس

مجله تخصصی برای علاقه مندان به اخبار و تحلیل های مالی و تجاری در بورس

مجله The Economist USA فوریه 6 ؛ 2021

صاعقه نسخه 1.01 برای اندروید 2.3+

صاعقه نسخه 1.01 برای اندروید 2.3+

صاعقه

جدید ترین مولودی های ویژه ولادت حضرت علی اکبر

جدید ترین مولودی های ویژه ولادت حضرت علی اکبر

مولودی روز جوان

Over Pro 6.10.1 for Android +4.0

Over Pro 6.10.1 for Android +4.0

ویرایش عکس با متون

Widget 504 v1.2.5 for Android +2.1

Widget 504 v1.2.5 for Android +2.1

یادگیری 504 لغت ضروری انگلیسی

Opera Mobile 93.2.4906.86283 + GX for Android 9.0

Opera Mobile 93.2.4906.86283 + GX for Android 9.0

اپرا

فعالساز ( کرک ) محصولات Microsoft ویندوز و آفیس (28 آبان 1404)

فعالساز ( کرک ) محصولات Microsoft ویندوز و آفیس (28 آبان 1404)

فعالساز ویندوز و آفیس

The Lion King

The Lion King

شیرشاه

آموزش برنامه نویسی سه لایه

آموزش برنامه نویسی سه لایه

آشنایی با مدل برنامه نویسی سه لایه

علی از زبان علی

علی از زبان علی

کتاب زیبای علی از زبان علی

مجله Gun Digest دسامبر 2020

مجله Gun Digest دسامبر 2020

مجله تخصصی برای علاقه مندان به اسحله شناسی

Clash Royale 120169018 for Android +7.0

Clash Royale 120169018 for Android +7.0

کلش رویال

Racing Fever Moto 1.81.0 For Android +4.0.3

Racing Fever Moto 1.81.0 For Android +4.0.3

موتور سواری اندروید

Pluralsight - Enterprise Strength Mobile Device Security

Pluralsight - Enterprise Strength Mobile Device Security

فیلم آموزش افزایش امنیت دستگاه‌های موبایل در محیط‌های کاری

آموزش نرم افزار SQL Server 2005

آموزش نرم افزار SQL Server 2005

آموزش اس کیو ال سرور 2005

The Ultimate Lightroom Preset Collection

The Ultimate Lightroom Preset Collection

مجموعه کامل و بی نظیر تنظیمات آماده برای فتوشاپ و لایتروم

Smart Computing Magazine January 2009

Smart Computing Magazine January 2009

مجله کامپیوتری اسمارت کامپیوتینگ

مرجع کامل آموزش زبان PHP

مرجع کامل آموزش زبان PHP

آموزش زبان پی اچ پی

Paragon NTFS for Mac 15.5.106

Paragon NTFS for Mac 15.5.106

پاراگون ان تی اف سی برای مک

Timely Alarm Clock 1.3.2 for Android +4.0.3

Timely Alarm Clock 1.3.2 for Android +4.0.3

زنگ هشدار هوشمند اندروید

Lynda - Microsoft Project Server 2013 Administration

Lynda - Microsoft Project Server 2013 Administration

فیلم آموزش مدیریت مایکروسافت پراجکت سروِر 2013

آموزش سریع کد ایگنایتر

آموزش سریع کد ایگنایتر

آموزش ایگنایتر

Story about the garish sun and arid soil of the Hindoo

Story about the garish sun and arid soil of the Hindoo

افسانه های هند

Running With Rifles + Update v1.20

Running With Rifles + Update v1.20

یورش با تفنگداران

QQPlayer 3.0.1.301 for Android +2.3

QQPlayer 3.0.1.301 for Android +2.3

پلیر تصویری با محیط کاربری زیبا و امکانات مناسب

Udemy - Mastering Artificial Intelligence

Udemy - Mastering Artificial Intelligence

دوره آموزش ویدئویی هوش مصنوعی

3uTools 3.29.009

3uTools 3.29.009

مدیریت دستگاه‌های اپل در ویندوز

Resident Evil 7 Biohazard – Gold Edition

Resident Evil 7 Biohazard – Gold Edition

رزیدنت اویل

منزلت و جایگاه حضرت فاطمه زهرا (س) از حجت الاسلام والمسلمین علی نظری منفرد - 4 جلسه

منزلت و جایگاه حضرت فاطمه زهرا (س) از حجت الاسلام والمسلمین علی نظری منفرد - 4 جلسه

حاج آقا علی نظری منفرد با موضوع منزلت و جایگاه حضرت فاطمه زهرا (س)

کتاب راهنمای کار با پایگاه داده PostgreSQL

کتاب راهنمای کار با پایگاه داده PostgreSQL

آشنایی با پایگاه داده PostgreSQL

تلاوت مجلسی استاد سعید مسلم سوره مبارکه اعلی

تلاوت مجلسی استاد سعید مسلم سوره مبارکه اعلی

تلاوت سعید مسلم سوره اعلی

خبرنامه

با عضویت در خبرنامه، زودتر از همه باخبر باش!