2025年6月17日,字節(jié)跳動(dòng)旗下智能助手豆包正式在電腦版及網(wǎng)頁(yè)端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網(wǎng)頁(yè)鏈接,即可一鍵生成由兩位AI主播演繹的對(duì)話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語(yǔ)音效果和秒級(jí)轉(zhuǎn)化效率,迅速引發(fā)內(nèi)容創(chuàng)作者、學(xué)生群體及職場(chǎng)人士的關(guān)注。
技術(shù)突破:真人級(jí)語(yǔ)音交互,秒級(jí)生成播客
據(jù)豆包團(tuán)隊(duì)介紹,該功能基于其自主研發(fā)的語(yǔ)音播客模型,通過(guò)流式模型與端到端技術(shù),將文本創(chuàng)作到音頻生成的全流程壓縮至數(shù)秒內(nèi)完成。生成的播客不僅音色自然、停頓合理,還融入了日常對(duì)話中的語(yǔ)氣詞和附和習(xí)慣,例如“嗯”“對(duì)”“其實(shí)呢”等口語(yǔ)化表達(dá),使對(duì)話更貼近真人交流場(chǎng)景。
內(nèi)測(cè)用戶反饋顯示,該功能尤其適用于處理長(zhǎng)篇學(xué)習(xí)資料或行業(yè)報(bào)告。例如,學(xué)生可將課堂PPT拍照上傳,AI自動(dòng)提取文字后生成深度講解的播客;職場(chǎng)人則可將網(wǎng)頁(yè)文章轉(zhuǎn)化為通勤路上的“聽(tīng)書”內(nèi)容。一位參與測(cè)試的用戶表示:“以前看一篇萬(wàn)字報(bào)告要半小時(shí),現(xiàn)在直接生成播客,邊走邊聽(tīng)效率翻倍。”
場(chǎng)景覆蓋:學(xué)習(xí)、工作、娛樂(lè)全適配
目前,豆包AI播客支持多種輸入方式:
文檔轉(zhuǎn)播客:上傳PDF、Word等格式文件,AI自動(dòng)解析內(nèi)容并生成對(duì)話; 鏈接轉(zhuǎn)播客:支持微信公眾號(hào)、知乎、騰訊文檔等公開(kāi)鏈接,一鍵抓取文字生成音頻; 拍照轉(zhuǎn)播客:通過(guò)手機(jī)拍攝PPT、書籍等紙質(zhì)資料,OCR識(shí)別后轉(zhuǎn)化為播客。
此外,用戶可自由選擇主播音色(如“新聞主播風(fēng)”“輕松對(duì)話風(fēng)”)及對(duì)話模式(男女對(duì)談、雙男或雙女組合),甚至自定義角色身份(如“專家訪談”“師生討論”)。例如,將學(xué)術(shù)論文轉(zhuǎn)化為“教授與學(xué)生探討”的播客,或把產(chǎn)品說(shuō)明書改寫為“客服與用戶問(wèn)答”形式,極大提升了內(nèi)容的趣味性和可聽(tīng)性。
行業(yè)對(duì)比:差異化優(yōu)勢(shì)凸顯
與市場(chǎng)上同類產(chǎn)品相比,豆包AI播客的核心競(jìng)爭(zhēng)力在于“低成本、高時(shí)效、強(qiáng)互動(dòng)”。例如,有道文檔FM雖支持多格式輸入,但生成音頻需手動(dòng)調(diào)整角色分配;而谷歌NotebookLM的中文播客功能則存在語(yǔ)言適配性不足的問(wèn)題。豆包團(tuán)隊(duì)表示,其模型通過(guò)海量中文對(duì)話數(shù)據(jù)訓(xùn)練,更符合國(guó)內(nèi)用戶的表達(dá)習(xí)慣。
目前,該功能已在豆包電腦版、網(wǎng)頁(yè)端及扣子空間平臺(tái)上線,手機(jī)端App也已開(kāi)啟小流量測(cè)試,預(yù)計(jì)近期全量開(kāi)放。豆包產(chǎn)品負(fù)責(zé)人透露,未來(lái)將推出“多角色扮演”功能,允許用戶上傳劇本或故事大綱,由AI生成多人對(duì)話的廣播劇,進(jìn)一步拓展內(nèi)容創(chuàng)作邊界。
市場(chǎng)影響:重新定義“聽(tīng)書”體驗(yàn)
隨著AI播客功能的普及,內(nèi)容消費(fèi)場(chǎng)景正從“閱讀”向“聆聽(tīng)”遷移。艾瑞咨詢數(shù)據(jù)顯示,2025年中國(guó)有聲內(nèi)容市場(chǎng)規(guī)模預(yù)計(jì)突破800億元,其中AI生成內(nèi)容占比將達(dá)30%。豆包AI播客的推出,不僅降低了播客創(chuàng)作門檻,也為教育、出版、傳媒等行業(yè)提供了新的內(nèi)容分發(fā)渠道。
例如,出版社可將新書章節(jié)轉(zhuǎn)化為播客試聽(tīng)片段,吸引讀者購(gòu)買;企業(yè)則可將產(chǎn)品白皮書轉(zhuǎn)化為音頻,通過(guò)播客平臺(tái)觸達(dá)更多用戶。一位教育行業(yè)從業(yè)者評(píng)價(jià):“AI播客讓知識(shí)傳播更碎片化、更沉浸,未來(lái)或成為在線教育的重要工具。”
結(jié)語(yǔ):AI賦能內(nèi)容創(chuàng)作的新里程碑
豆包AI播客功能的上線,標(biāo)志著AI技術(shù)在內(nèi)容生成領(lǐng)域的又一次突破。從文本到音頻的“一鍵轉(zhuǎn)化”,不僅解放了用戶的雙手,更讓知識(shí)獲取變得更加高效、便捷。隨著技術(shù)的持續(xù)迭代,AI播客或?qū)⒊蔀槊總€(gè)人口袋里的“私人電臺(tái)”,重新定義信息傳播與消費(fèi)的方式。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性價(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20
9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G
9月24日,阿里云在云棲大會(huì)上宣布新一輪全球基礎(chǔ)設(shè)施擴(kuò)建計(jì)劃:將在巴西、法國(guó)和荷蘭首次設(shè)立云計(jì)算地域節(jié)點(diǎn)(region),并將擴(kuò)建墨西哥、日本、韓國(guó)、馬來(lái)西亞和迪拜的數(shù)據(jù)中心,以便更好服務(wù)全球客戶日益增長(zhǎng)的AI和云計(jì)算需求。目前,阿里云在全球29個(gè)地區(qū)運(yùn)營(yíng)91個(gè)可用區(qū),是中國(guó)最大、亞太第一的云服務(wù)商