乱码乱a∨中文字幕,在线免费激情视频,亚洲欧美久久夜夜潮,国产在线网址

  1. <sub id="hjl7n"></sub>

    1. <sub id="hjl7n"></sub>

      <legend id="hjl7n"></legend>
      1. 創(chuàng)業(yè)頭條
      2. 前沿領(lǐng)域
      3. AI智能
      4. 正文

      清華學(xué)霸引爆“長文本”大戰(zhàn),大模型的應(yīng)用前景清晰了嗎?

       2024-04-02 13:30  來源:A5專欄  我來投稿 撤稿糾錯

        阿里云優(yōu)惠券 先領(lǐng)券再下單

      文 | 智能相對論

      作者 | 沈浪

      Long-LLM(長文本大模型)時代似乎來得有些突然,而引爆這場熱潮的,竟是一家由清華學(xué)霸牽頭的本土AI初創(chuàng)企業(yè)。

      前不久,月之暗面(Moonshot AI)公司宣布旗下對話式 AI 助理產(chǎn)品 Kimi 應(yīng)用現(xiàn)已支持200萬字無損上下文輸入。

      對比去年10月份Kimi上線時僅支持的20萬字,這一波升級直接提升了10倍文本處理能力,同時也引起了強烈的市場反應(yīng),特別是在資本市場,Kimi概念股應(yīng)運而生,諸如九安醫(yī)療、華策影視、中廣天擇等都受益于Kimi概念而實現(xiàn)了股價不同程度的漲幅。

      這些刺激更讓大模型領(lǐng)域徹底卷起了長文本大戰(zhàn)。

      01 “長文本”大戰(zhàn),卷的不是字數(shù)而是財力

      阿里率先完成自家的大模型產(chǎn)品升級,強化長文本處理能力,免費面向大眾開放最高1000萬字的長文本處理能力。

      360則緊隨其后,宣布旗下360智腦正式內(nèi)測500萬字的長文本功能,并在360AI瀏覽器開放給用戶使用。

      而百度也宣布在下個月進行版本升級,開放長文本能力,文字范圍會在200萬-500萬字。

      目前,文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字,Claude3200k上下文約16萬漢字。

      可以說,這一波熱潮直接把國內(nèi)的大模型廠商一下子都拉進了百萬量級的長文本競賽,而主流廠商的入局也為這場“長文本”大戰(zhàn)增添了很多看頭。

      目前來看,“長文本”大戰(zhàn)的賽點主要呈現(xiàn)在兩個方面。

      一方面,是大模型的支持文本參數(shù)。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等,都在極力向市場爭“彩頭”,告訴用戶自家的長文本處理能力足夠“長”。

      另一方面,是長文本處理能力的開放程度。有意思的是,Kimi是免費開放給用戶使用的,阿里通義千問的長文本處理功能也是免費的,360智腦、百度文心一言也沒有要收費的意思。——以“長文本”大戰(zhàn)為例,今年的大模型競爭遠比去年要“卷”得多。

      還記得去年大火的妙鴨相機,以及各式各樣的圖片生成式服務(wù),都或多或少地通過各種形式如充值、辦會員等,要求用戶付費才能體驗。

      今年大模型領(lǐng)域的這把“火”燒得旺,也燒的離奇地“free”。

      為什么?

      Kimi自升級以來,就有大量用戶不斷涌入,激增的流量更是一度讓月之暗面(Moonshot AI)的服務(wù)器承受了巨大的壓力,一度陷入宕機,旗下的App和小程序都無法正常使用。

      根據(jù)月之暗面(Moonshot AI)發(fā)布的官方消息,從3.20觀測到流量異常增高后,已經(jīng)進行了5次擴容工作。推理資源會持續(xù)配合流量進行擴容,以盡量承載持續(xù)增長的用戶量。

      簡單來說,用戶對長文本功能是非常有興趣的,相關(guān)的市場需求還在保持持續(xù)性的、爆炸性的增長。同時,大量的用戶涌進,不僅提高了大模型產(chǎn)品的知名度,更重要的是在大量用戶的基礎(chǔ)上通過類似于UGC的模式去探索大模型的應(yīng)用,或許更能進一步推動Long-LLM(長文本大模型)的商業(yè)化進程。

      當(dāng)然,在這個過程中,不可避免地就得投入大量資金,一旦商業(yè)化加速,大模型廠商就得做好“卷”財力的準(zhǔn)備。

      阿里通義千問目前免費對所有人開放高達萬頁的文檔處理能力,如果要計算成本,按照目前最便宜的市價0.1元/頁,10000頁的文檔光解析費用就要1000元,這還不包括解析完成之后大模型處理文檔的成本??紤]到通義千問網(wǎng)頁、APP、釘釘?shù)榷鄠€端口的用戶基數(shù),需要投入的資金恐怕不會是個小數(shù)目。

      大模型的商業(yè)化在開始階段并非“賺錢”,而是“燒錢”。

      02 長文本,直接“接駁”商業(yè)化場景

      在大模型的商業(yè)化進程上,長文本的爆火是很關(guān)鍵的一環(huán)。

      就大模型的技術(shù)原理而言,解決長文本問題是必要的。因為文本長度的提高,對應(yīng)的模型能解決問題的邊界也將大幅提升,兩者呈現(xiàn)出明顯的正向關(guān)系。

      傳統(tǒng)的文本處理模型受限于訓(xùn)練結(jié)構(gòu),可支持的文本范圍都不算長,在處理復(fù)雜任務(wù)和深度專業(yè)知識(這一類知識往往都是長篇巨著)時,只能拆解輸入訓(xùn)練,由此就有可能導(dǎo)致輸出的結(jié)果上下文邏輯不連貫不順暢等問題。

      區(qū)別于傳統(tǒng)的文本處理模型,長文本模型就具備更準(zhǔn)確的文本理解和生成能力以及更強大的跨領(lǐng)域遷移能力。這對于打造垂直領(lǐng)域的行業(yè)專家是一個非常必要的能力支持,比如面向一些長篇巨制的醫(yī)療文獻、法律文件、財務(wù)報告等,長文本模型就具備更好的理解能力,對應(yīng)完成跨領(lǐng)域?qū)W習(xí)和應(yīng)用,從而打造出更專業(yè)的醫(yī)療助理、法律助理以及金融助理等應(yīng)用。

      話不多說,實踐一下。

      在這里,「智能相對論」向阿里通義千問相繼“投喂”了幾本長達數(shù)百頁的專業(yè)書籍,涵蓋以《高產(chǎn)母豬飼養(yǎng)技術(shù)有問必答》為代表的農(nóng)業(yè)養(yǎng)殖、以《犬貓營養(yǎng)需要》為代表的寵物喂養(yǎng)等等小眾領(lǐng)域。

      結(jié)果所能實現(xiàn)的效果確實令人驚訝,阿里通義千問不僅能高度概括總結(jié)這些長篇巨著的主要內(nèi)容,還能有針對性的給出具體篇章的知識解答。比如,在《高產(chǎn)母豬飼養(yǎng)技術(shù)有問必答》一書中,「智能相對論」向其提問“夏季高溫提問應(yīng)該如何飼養(yǎng)母豬?”很快就得到了書中的精煉解答。

      這意味著什么?只要用戶有足夠多的專業(yè)書籍“投喂”給大模型,那么大模型就可以成長為一個專業(yè)的專家助理,幫助用戶快速解答相關(guān)專業(yè)問題。

      在日常生活中,或許有很多書籍是我們沒辦法去仔細閱讀和學(xué)習(xí)的,但是只要有長文本大模型予以支持,那么基本上人人都能創(chuàng)造一個專業(yè)的垂直領(lǐng)域助理。

      這或許會顛覆現(xiàn)在我們獲取信息、知識的渠道,去百度搜索或是去知乎提問、亦或是去小紅書討論這些路徑都將被替代。

      在Kimi開放20萬字文本處理能力的時候,其做了一個簡單的對比,20萬字等于什么?答案是等于先秦的全部古籍。隨著長文本大模型進入百萬量級的迭代,那么這些能力還能實現(xiàn)進一步的進化,對應(yīng)所賦予場景應(yīng)用的機會就是無限的。

      如今,在AI領(lǐng)域,Agent的話題也很火,被認為是下一個主流的應(yīng)用形態(tài)。那么,打造Agent的關(guān)鍵是什么?答案正是大模型的長文本處理能力。

      比如,Kimi就在幫助元隆雅圖等公司進行營銷升級,基于長文本處理能力來提供爆品文案分析、文案寫作、市場分析、輔助營銷策劃等功能。

      盡管現(xiàn)在很多相關(guān)的應(yīng)用還處在探索階段,但是誰又能確定下一個爆款應(yīng)用不是出自自家的大模型+某個C端用戶的想法/某個企業(yè)客戶的業(yè)務(wù)融合?正因如此,大模型廠商們才不顧一切的升級并開放長文本功能,為下一場應(yīng)用上的爆火做準(zhǔn)備。

      目前,長本文的火爆還只是技術(shù)上的,接下來的爆點大概率將是應(yīng)用上的爆發(fā)。

      03 寫在最后

      2024年是大模型大規(guī)模走向商業(yè)化的關(guān)鍵一年。從Kimi的火爆程度來看,以長文本為代表的技術(shù)迭代走向C端引發(fā)了非常積極的反饋。同時,在「智能相對論」的實踐中,也預(yù)感這一能力隨著技術(shù)的成熟和完善,必然會在C端用戶的手中被“玩出花來”。

      只是目前很多的“玩法”還缺乏打磨,顯得比較粗糙。OpenAI在發(fā)布GPT商店時,就期望要打造一個全新的生態(tài),人人都能創(chuàng)造自己的專屬GPTs。

      現(xiàn)在,擺在大眾面前的長文本熱潮,其實就是一個全民時代到來的信號。只要用戶有書,會投喂,那么同樣可以在國內(nèi)的大模型平臺上打造出屬于自己想要的專業(yè)助理,進而延伸到應(yīng)用端的火爆。

      當(dāng)然,在這個過程中,書籍的版權(quán)問題、平臺的審核問題以及巨大的流量涌入所帶來的諸多挑戰(zhàn)和問題,也是大模型走向商業(yè)化的難點。但是,其根本的方向是清晰的,Long-LLM(長文本大模型)時代已經(jīng)拉開序幕,從技術(shù)到應(yīng)用,接下來大模型廠商們有得卷了。

      說實在,就目前各大廠商公布的參數(shù),從500萬到1000萬,基本上也足夠用了。大模型在長文本技術(shù)層面或許不會再有什么值得卷了,哪怕是有也只是背地里正常迭代和發(fā)展。

      接下來的爆點只能是往應(yīng)用層面來看。不管是To C還是To B,誰家的平臺最先把大眾化的應(yīng)用探索并驗證出來,再加以打磨推向大眾市場,那么誰就有可能成為下一個市場的寵兒。

      *本文圖片均來源于網(wǎng)絡(luò)

      此內(nèi)容為【智能相對論】原創(chuàng),

      僅代表個人觀點,未經(jīng)授權(quán),任何人不得以任何方式使用,包括轉(zhuǎn)載、摘編、復(fù)制或建立鏡像。

      部分圖片來自網(wǎng)絡(luò),且未核實版權(quán)歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯(lián)系。

      •AI產(chǎn)業(yè)新媒體;

      •澎湃新聞科技榜單月度top5;

      •文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

      •著有《人工智能 十萬個為什么》

      •【重點關(guān)注領(lǐng)域】智能家電(含白電、黑電、智能手機、無人機等AIoT設(shè)備)、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

      申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

      相關(guān)文章

      • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

        在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高校科研機構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

        標(biāo)簽:
        弈動
      • 甌江論道:AI賦能綠色發(fā)展

        2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

        標(biāo)簽:
        ai技術(shù)
      • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

        AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

        標(biāo)簽:
        阿里巴巴
      • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

        我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

      • H20芯片開賣即叫停,英偉達如何解圍?

        文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達已悄然向其關(guān)鍵供應(yīng)商——包括負責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

        標(biāo)簽:
        英偉達
      • 真正的「國產(chǎn)英偉達」來了

        文/二風(fēng)來源/節(jié)點財經(jīng)一場關(guān)于“中國芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請。作為中國半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達背景、高達80億元人民幣的募資雄心,以及在國產(chǎn)GPU領(lǐng)域取

        標(biāo)簽:
        英偉達

      編輯推薦