?。核伎普J(rèn)為,未來(lái)幾年內(nèi),AI將能處理大部分客戶服務(wù)電話。為此,該公司推出了新的會(huì)話式AI代理,旨在減少等待時(shí)間,優(yōu)化客戶服務(wù)體驗(yàn)。
Webex AI代理:在思科的WebexOne會(huì)議上發(fā)布,預(yù)計(jì)于2025年初上線。此AI代理將充當(dāng)客戶服務(wù)的AI助手,能夠通過(guò)自然語(yǔ)言交互處理客戶問(wèn)題。
創(chuàng)新優(yōu)勢(shì):這款代理能夠應(yīng)對(duì)復(fù)雜任務(wù),如重新預(yù)訂航班、信用卡更換等,通常需要人工干預(yù)的操作也可以處理,提升了客戶服務(wù)的響應(yīng)速度和解決率。
自2022年AI技術(shù)興起以來(lái),Adobe不斷在其產(chǎn)品中加入生成式AI,盡管其主要用戶群體——數(shù)字藝術(shù)家——對(duì)AI的態(tài)度日益負(fù)面。
Adobe的生成式AI副總裁Alexandru Costin表示,拒絕AI的創(chuàng)作者在新的數(shù)字時(shí)代中難以成功,因?yàn)槲磥?lái)Adobe的所有工具都會(huì)包含AI功能。他建議用戶不要使用沒(méi)有AI功能的舊版軟件。Adobe數(shù)字媒體部門(mén)總裁David Wadhwani補(bǔ)充道,即使AI生成的內(nèi)容不會(huì)達(dá)到手工藝術(shù)的價(jià)值,傳統(tǒng)創(chuàng)作依舊被需要。他認(rèn)為,真正手工創(chuàng)作的藝術(shù)在未來(lái)將更加珍貴。
Adobe推動(dòng)AI的決定被認(rèn)為主要是出于盈利考量,尤其是基于其AI功能(如Firefly)的高市場(chǎng)接受度。
OpenAI 推出的 AI 轉(zhuǎn)錄工具 Whisper 被認(rèn)為接近“人類級(jí)別的穩(wěn)健性和準(zhǔn)確性”,但存在重大缺陷:經(jīng)常會(huì)編造內(nèi)容,行業(yè)內(nèi)稱為“幻覺(jué)”。
研究人員發(fā)現(xiàn) Whisper 生成的“幻覺(jué)”可能涉及種族評(píng)論、暴力言論,甚至虛構(gòu)的醫(yī)療處理。Whisper 被廣泛應(yīng)用于訪談、字幕生成等領(lǐng)域,尤其在醫(yī)療領(lǐng)域用于轉(zhuǎn)錄醫(yī)患對(duì)話,盡管 OpenAI 曾警告不應(yīng)在“高風(fēng)險(xiǎn)領(lǐng)域”使用。一些研究人員發(fā)現(xiàn),在每10個(gè)音頻轉(zhuǎn)錄中有8個(gè)會(huì)出現(xiàn)“幻覺(jué)”,另一些則發(fā)現(xiàn)超半數(shù)轉(zhuǎn)錄含有不準(zhǔn)確內(nèi)容。
研究表明,即便是短小、錄音質(zhì)量良好的音頻片段,也可能存在問(wèn)題。Whisper 常被用來(lái)生成字幕,特別是為聾人和聽(tīng)力障礙人士服務(wù),這些人可能無(wú)法識(shí)別幻覺(jué)內(nèi)容。
Saras AI研究所成立,推出了全球首個(gè)專門(mén)針對(duì)人工智能的在線高等教育學(xué)位課程,包括副學(xué)士學(xué)位和學(xué)士學(xué)位。與傳統(tǒng)的AI證書(shū)項(xiàng)目不同,Saras提供全面的學(xué)位教育,幫助學(xué)生在快速擴(kuò)展的AI行業(yè)中脫穎而出。
課程設(shè)置:該課程由頂級(jí)AI雇主和實(shí)踐者參與設(shè)計(jì),涵蓋了從理論到實(shí)際應(yīng)用的AI知識(shí),包括最終的畢業(yè)項(xiàng)目和實(shí)習(xí),學(xué)生將獲得開(kāi)發(fā)真實(shí)AI產(chǎn)品和解決方案的實(shí)踐經(jīng)驗(yàn),強(qiáng)調(diào)AI的倫理和負(fù)責(zé)任的應(yīng)用。
就業(yè)機(jī)會(huì):畢業(yè)生將獲得直接進(jìn)入AI崗位的技能,如AI/ML工程師、數(shù)據(jù)科學(xué)家和生成式AI工程師,這些崗位在當(dāng)前就業(yè)市場(chǎng)中具有較高的薪資競(jìng)爭(zhēng)力。
零售商正在通過(guò)小型AI模型降低運(yùn)營(yíng)成本,這些模型比大型模型更經(jīng)濟(jì)高效,同時(shí)能夠提供類似的準(zhǔn)確性。
H2O.ai推出的兩個(gè)小型AI模型(0.8億和2億參數(shù))用于文檔處理和文本識(shí)別,已在Hugging Face上免費(fèi)提供。這些模型專注于光學(xué)字符識(shí)別(OCR)等任務(wù),并且在一些基準(zhǔn)測(cè)試中超過(guò)了更大的競(jìng)爭(zhēng)對(duì)手。小型模型的優(yōu)勢(shì)在于,它們所需的計(jì)算資源更少,可以幫助中小型企業(yè)(SMBs)優(yōu)化庫(kù)存管理、需求預(yù)測(cè)和自動(dòng)化補(bǔ)貨,從而增強(qiáng)運(yùn)營(yíng)效率。
這些小型模型降低了新企業(yè)的進(jìn)入門(mén)檻,讓初創(chuàng)公司無(wú)需昂貴的GPU集群即可部署專注于動(dòng)態(tài)定價(jià)和需求預(yù)測(cè)等高價(jià)值任務(wù)的AI解決方案。在客戶服務(wù)領(lǐng)域,AI可以處理常規(guī)查詢,而復(fù)雜的支持任務(wù)則由人工接手,提升了服務(wù)質(zhì)量和效率。
合作內(nèi)容:環(huán)球音樂(lè)集團(tuán)(UMG)與洛杉磯的AI音樂(lè)公司Klay Vision達(dá)成合作,致力于創(chuàng)建“符合音樂(lè)產(chǎn)業(yè)和創(chuàng)作者利益的商業(yè)倫理AI模型”。
目標(biāo):合作聚焦于在AI生成音樂(lè)的過(guò)程中尊重版權(quán)并推動(dòng)音樂(lè)創(chuàng)作,旨在確保AI技術(shù)不會(huì)威脅人類創(chuàng)作者的權(quán)益,同時(shí)開(kāi)創(chuàng)音樂(lè)版權(quán)盈利的新途徑。
Klay Vision的定位:Klay致力于成為支持AI音樂(lè)創(chuàng)新的核心力量,為音樂(lè)行業(yè)提供新產(chǎn)品和體驗(yàn),并承諾不會(huì)與現(xiàn)有音樂(lè)目錄直接競(jìng)爭(zhēng)。
主要項(xiàng)目:Klay計(jì)劃推出一種新的“大型音樂(lè)模型”(KLayMM),以改進(jìn)音樂(lè)AI技術(shù),并預(yù)備在未來(lái)幾個(gè)月內(nèi)發(fā)布其產(chǎn)品。
能保持口型同步、說(shuō)話風(fēng)格完美匹配 只需輸入音頻和參考視頻,即可生成同步的視覺(jué)配音 不僅讓嘴唇動(dòng)作與音頻完美匹配,還能保留說(shuō)話者的個(gè)性特點(diǎn),比如說(shuō)話的速度、語(yǔ)調(diào)和表情。
還能同步說(shuō)話者的風(fēng)格,比如輕松、嚴(yán)肅或激動(dòng)的語(yǔ)氣,讓配音更生動(dòng)。 不僅如此,還能實(shí)現(xiàn)視頻翻譯,將視頻說(shuō)話者的語(yǔ)音翻譯成其他語(yǔ)言。
2、再使用 Llama-3.1-70B-Instruct 模型,將處理后的文本轉(zhuǎn)化為播客轉(zhuǎn)錄,生成富有創(chuàng)意的內(nèi)容。
3、通過(guò) Llama-3.1-8B-Instruct 模型對(duì)轉(zhuǎn)錄進(jìn)行戲劇化處理,使其更具吸引力和互動(dòng)性。
4、將生成的文本轉(zhuǎn)換為播客音頻,使用多個(gè)文本到語(yǔ)音模型,也可以自己選擇其他TTS模型。