各種熱點(diǎn)背后,有兩個(gè)事情值得注意:
第一,實(shí)踐證明,AI落地一定是貼近已有需求,用原先無法想象的效率,完成用戶想做或必須做的事;第二,已有的AI應(yīng)用涉及文本、音頻、圖像等多種形式,但大多處于分散狀態(tài)。如果它們能被整合成一個(gè)多模態(tài)一站式AI應(yīng)用平臺(tái),AI落地會(huì)更加廣泛。
百度文庫是“跨模態(tài)+一站式“內(nèi)容創(chuàng)作的AI原生應(yīng)用代表。在Create2024百度AI開發(fā)者大會(huì)上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏介紹了百度文庫的新成果——智能漫畫和智能畫本功能。李彥宏表示:“百度文庫的智能漫畫能力,極大地提高了創(chuàng)作漫畫的效率,降低了漫畫創(chuàng)作的成本和門檻,可以讓更多有想法、有創(chuàng)意的人實(shí)現(xiàn)自己的漫畫創(chuàng)作夢。”
除了生成漫畫和畫本,用戶還可以在百度文庫生成研究報(bào)告、PPT、文檔、思維導(dǎo)圖,還能進(jìn)行拍圖生文等等。百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組總經(jīng)理何俊杰表示:“大語言模型重新打開了文庫的想象空間,它已經(jīng)進(jìn)化為一站式AI內(nèi)容創(chuàng)作平臺(tái)。”
創(chuàng)意如何輕盈落地
如果你愛看漫畫和小說,肯定有過這樣的時(shí)刻——這部漫畫劇情太精彩了,可是作者更新好慢,真想替他畫下去;作品里這兩人CP感好強(qiáng)!好想做二創(chuàng);這部玄幻小說設(shè)定有意思,要是文字能變成漫畫就更好了。
如果你是家長,在給孩子講故事時(shí)肯定也有過這樣的想法:孩子對故事里的場景和動(dòng)物有些陌生,理解起來有困難,有對應(yīng)的繪本就簡單多了。
這些需求很普遍,但在以前很難實(shí)現(xiàn)。大部分人沒接受過繪圖、分鏡訓(xùn)練,即使能想象出精彩畫面,創(chuàng)意也無法落地。但借助百度文庫,一切都變得可行。
例如,《周處除三害》是一個(gè)在《晉書》和《世說新語》里都有記載的歷史故事。用戶可以借百度文庫,用簡單幾個(gè)步驟,把年代久遠(yuǎn)的文字轉(zhuǎn)變?yōu)樯鷦?dòng)的畫面:
-
在百度文庫上,只需要輸入《周處除三害》相關(guān)的「一句話」主題,百度文庫將檢索相關(guān)內(nèi)容,自動(dòng)生成完整的故事分鏡和腳本
-
用戶進(jìn)行內(nèi)容調(diào)整后,可以選擇多種漫畫風(fēng)格,設(shè)定多種角色形象;
-
設(shè)置完畢后,百度文庫AI將自動(dòng)生成完整漫畫作品,自動(dòng)匹配豐富的人物對話文本,用戶可繼續(xù)在編輯器中進(jìn)行精調(diào)。

《周處除三害》智能漫畫創(chuàng)作全過程
漫畫是風(fēng)格化的,畫本則更廣泛通用。大會(huì)上,百度演示的智能畫本案例《小明不愛洗澡》,在畫風(fēng)上明顯更“包容”,適用于更低年齡段讀者的需求,可以有效填補(bǔ)家庭教育場景里的“繪本空白”。

《小明不愛洗澡》智能畫本生成結(jié)果
「深響」近期試用了百度文庫的智能漫畫和智能畫本功能,如大會(huì)演示的那樣,兩個(gè)功能易上手、速度快、效果好——只需輸入主題即可生成故事大綱,選擇“制作畫本”后稍加等待就能獲得完整結(jié)果。
試用過程中,「深響」也把百度文庫生成的繪本發(fā)給有娃的朋友,這位年輕媽媽對繪本的反饋是“畫面質(zhì)量、閱讀體驗(yàn)和市面上的親子繪本很接近”。看完后她還發(fā)來一些需求,比如“能不能以‘吃飯前要洗手’為主題做個(gè)繪本”,“小朋友剛跟我說了一些奇思妙想,能不能把它們變成繪本”。
和之前的體驗(yàn)一樣,這兩個(gè)需求同樣都只需“一句話”主題輸入,就能變成繪本輸出(輸入“吃飯前要洗手”,可以獲得《小貓咪咪學(xué)洗手》的繪本),整個(gè)操作過程幾乎是“傻瓜式”,它可以發(fā)生在親子互動(dòng)的各個(gè)環(huán)節(jié),家長和孩子的交流也因此變得更有趣生動(dòng)。

在百度文庫APP上生成“飯前洗手”繪本。全程操作簡單,畫面生動(dòng)可閱讀性強(qiáng)
錄屏:深響
當(dāng)然,如果想更精細(xì)地編輯故事文本,百度文庫也給了相應(yīng)的選項(xiàng)。你可以對生成的故事大綱進(jìn)行編輯,也可以對分鏡腳本進(jìn)行修改。或者,你也可以和孩子一起,在百度文庫的智能文檔里,利用AI交互,把孩子的創(chuàng)意變成一個(gè)完整的故事,然后再把這個(gè)故事變成好看的漫畫或繪本。正好423世界讀書日馬上要到了,利用百度文庫,家長和孩子都能實(shí)現(xiàn)“繪本自由”,讀書這件事會(huì)因?yàn)锳I變得更易得、更有趣。

百度文庫根據(jù)“機(jī)器人和人類一起保衛(wèi)地球”主題生成故事大綱和分鏡后,用戶可以做進(jìn)一步調(diào)整
截圖來源:百度文庫
這樣的交互體驗(yàn)和交付質(zhì)量是開創(chuàng)性的。目前,行業(yè)在“AI繪制漫畫”上仍存在一定痛點(diǎn),多數(shù)工具只能生成單圖、四宮格圖片,在場景關(guān)聯(lián)性、人物一致性、劇情還原度上都有待完善,且通常需要大量后期工作來調(diào)整。
而百度文庫不只是解決“繪制”環(huán)節(jié)的難點(diǎn),還將AI封裝于整個(gè)工作流程,在“指令生成故事”等方面進(jìn)行優(yōu)化提升,同時(shí)強(qiáng)化多場景及多人物處理、人物一致性、故事完整性、畫面細(xì)膩度、圖文與劇情匹配度等方面的專業(yè)表現(xiàn),這使得其生成的作品達(dá)到能“直接交付”的水平。
“跨模態(tài)+一站式”內(nèi)容創(chuàng)作的價(jià)值
跨模態(tài)指的是,百度文庫能夠處理各種文字、語音、圖像信息,能把不同模態(tài)的信息綜合起來,實(shí)現(xiàn)更精確的情境理解和輸出。在此基礎(chǔ)上,用戶可以在百度文庫一個(gè)平臺(tái)上,一站式實(shí)現(xiàn)不同類型的內(nèi)容創(chuàng)作。
簡言之,跨模態(tài)和一站式能力讓百度文庫有更廣泛的落地可能。它可以橫向進(jìn)入更多場景,縱向進(jìn)入更多環(huán)節(jié)。
“進(jìn)入更多場景”指的是,在工作生活中,你可以利用百度文庫完成更多需求,比如生成思維導(dǎo)圖、做研究報(bào)告、智能合成多個(gè)文檔、寫PPT和年終匯報(bào),或者直接發(fā)一張圖,讓文庫幫你生成小紅書文案?;谧匀徽Z言交互,你的產(chǎn)出過程會(huì)簡便得多、高效得多。

百度文庫AI解圖創(chuàng)作小紅書文案
以研究報(bào)告和PPT為例,一份研究報(bào)告涉及大量文字和圖表,一份精美的PPT需要用戶不斷調(diào)整樣式、文字、排版,傳統(tǒng)內(nèi)容編輯工具操作起來又很繁瑣,完成相應(yīng)的產(chǎn)出往往要耗費(fèi)大量精力。
借助百度文庫,用戶能輕松實(shí)現(xiàn)原本繁復(fù)操作才能達(dá)到的效果——做個(gè)研究報(bào)告,只需輸入報(bào)告主題,或者用簡單的語音交互,幾分鐘內(nèi)便能獲得一份結(jié)構(gòu)嚴(yán)謹(jǐn)、圖表清晰、內(nèi)容翔實(shí)的報(bào)告。基于這份報(bào)告,用戶還能進(jìn)行精細(xì)化的編輯調(diào)整,選擇不同風(fēng)格的模版封面及導(dǎo)出格式。

百度文庫“智能生成研究報(bào)告”演示
類似的,用戶只需要輸入主題或上傳文檔,或者簡單“動(dòng)動(dòng)嘴”,就能利用百度文庫在幾十秒內(nèi)生成一份邏輯清晰、配圖準(zhǔn)確的PPT。此外,百度文庫也支持模版上傳、文檔生成PPT、PPT內(nèi)生成專業(yè)圖表、PPT在線調(diào)整編輯、一鍵生成演講稿和思維導(dǎo)圖等功能,能夠做到多格式、多文檔的生成、編輯全能力打通。
全能力打通破解的是當(dāng)前AI應(yīng)用的核心痛點(diǎn)。一直以來,市場關(guān)于AI有種“矛盾”的態(tài)度,大家都覺得AI很強(qiáng),但實(shí)際應(yīng)用體驗(yàn)總是“不盡人意”。目前,AI在工作生活中的落地還是處于“分散”狀態(tài),大部分人只用AI解決點(diǎn)狀需求,沒能把它融入工作流程中。如果想用AI完整、順暢地解決需求,則需要專門搭建一套AI工作流,整個(gè)過程費(fèi)時(shí)費(fèi)力。
百度文庫的升級打破了僵局。從“頭腦風(fēng)暴”、“寫大綱”,到生成和編輯文檔,再到PPT生成、思維導(dǎo)圖等文件的生成,各個(gè)場景的需求用戶都可以基于百度文庫解決。重要的是,百度文庫“進(jìn)入更多環(huán)節(jié)”的同時(shí),用戶操作門檻低,且體驗(yàn)順滑,無需在文件傳輸和轉(zhuǎn)換等問題上多花費(fèi)精力。
而百度文庫的全場景指令創(chuàng)作和編輯,意味著用戶僅需簡單的語音指令,即可不受地點(diǎn)限制地高效完成工作中的常見需求。低門檻操作+全場景覆蓋+靈活編輯+PC移動(dòng)雙端操作,百度文庫帶來的是新的辦公體驗(yàn)。百度文庫并非只解決單一環(huán)節(jié)的問題,而是成長為一個(gè)完整的生產(chǎn)力平臺(tái)。

百度文庫全場景指令創(chuàng)作和編輯演示
從趣味工具,到生產(chǎn)力革新
早年,在圖形界面交互出現(xiàn)前,計(jì)算機(jī)交互靠的是各種指令和參數(shù),學(xué)習(xí)門檻高,只有少數(shù)極客玩得轉(zhuǎn)。但隨著計(jì)算機(jī)交互方式和技術(shù)的發(fā)展,大眾經(jīng)過簡單學(xué)習(xí)就能操作個(gè)人電腦,PC和互聯(lián)網(wǎng)時(shí)代得以到來。
今天的AI技術(shù)也是如此。一年多以前,大家都在鉆研怎么寫Prompt,精調(diào)一張繪畫作品需要不斷測試提示詞。隨著技術(shù)和產(chǎn)品的發(fā)展,繁瑣和專業(yè)的操作被不斷簡化,AI生成結(jié)果變得穩(wěn)定且高質(zhì),外加自然語言本身就是“零門檻”的交互方式,AI正在加速往更大眾化的方向滲透。
AI時(shí)代的敘事漸漸從“趣味技術(shù)工具”轉(zhuǎn)向“生產(chǎn)力革新”。用戶和行業(yè)都將從中受益——用戶側(cè),原先無法實(shí)現(xiàn)的需求變得觸手可及;行業(yè)側(cè),隨著以智能漫畫和智能畫本為代表的多模態(tài)AI能力的成熟,影視文娛行業(yè)、家庭教育行業(yè)、出版行業(yè)都能從中找到提效空間。
僅僅一年多,AI的發(fā)展就又進(jìn)入了新的階段。“跨模態(tài)+一站式”趨勢正在推動(dòng)AI內(nèi)容創(chuàng)作進(jìn)一步落地,而百度文庫和趨勢同頻,且是趨勢中的領(lǐng)先者。
這是多重因素共同造就的——百度文庫在文本理解與數(shù)據(jù)分析領(lǐng)域有豐富積累,能準(zhǔn)確抓取并分析文字中的數(shù)據(jù)信息,再轉(zhuǎn)換生成適合的圖表;文心大模型又為百度文庫注入了新活力。據(jù)悉,相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%;疊加百度文庫多年來對用戶需求的洞察,百度文庫得以重構(gòu)為“一站式AI內(nèi)容創(chuàng)作平臺(tái)”。
大會(huì)上,李彥宏提到,AI正在掀起一場創(chuàng)造力革命。“未來開發(fā)應(yīng)用就像拍個(gè)短視頻一樣簡單,人人都是開發(fā)者,人人都是創(chuàng)造者”。
百度文庫的進(jìn)展,正在讓“零門檻、一站式”創(chuàng)作落地現(xiàn)實(shí)。從過往的技術(shù)變革經(jīng)驗(yàn)來看,新技術(shù)的發(fā)展和滲透常常是指數(shù)級的,智能漫畫和智能畫本將推動(dòng)AI大眾化進(jìn)程。AI時(shí)代的增長曲線,顯然越來越陡峭了。

