近日,人工智能領(lǐng)域的大模型創(chuàng)新者智譜公司宣布了一項重要進展,正式推出了其2025年開源計劃的首個里程碑產(chǎn)品——CogView4,這是一款開創(chuàng)性的開源文生圖模型,尤為引人注目的是,它首次實現(xiàn)了對漢字生成的支持。
CogView4在業(yè)界權(quán)威的DPG-Bench基準(zhǔn)測試中脫穎而出,綜合評分位居榜首,標(biāo)志著在開源文生圖模型領(lǐng)域達(dá)到了新的技術(shù)高峰(SOTA)。尤為該模型遵循Apache 2.0協(xié)議,這在圖像生成模型中是前所未有的。
智譜公司在GitHub平臺上分享了CogView-4模型的diffusers版本,這一版本配備了高達(dá)60億的參數(shù),不僅支持中文輸入,還能直接將中文文本轉(zhuǎn)化為圖像,極大地拓寬了文生圖技術(shù)的應(yīng)用場景。
智譜公司還提供了詳盡的技術(shù)文檔和示例代碼,以幫助開發(fā)者更好地理解和利用CogView4模型。這一舉措無疑將加速文生圖技術(shù)在中文環(huán)境下的普及和應(yīng)用。
對于對人工智能和文生圖技術(shù)感興趣的開發(fā)者而言,CogView4無疑是一個不可多得的資源。感興趣的朋友可以通過以下開源地址獲取更多信息: