IT之家9月6日消息,百川智能今日召開主題為“百川匯海,開源共贏”的大模型發(fā)布會,正式開源微調后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat與其4bit量化版本,并且均為免費可商用。

▲圖源“百川智能”公眾號,下同
百川智能此次還開源了模型訓練的Check Point,并宣布將發(fā)布Baichuan 2技術報告,詳細介紹Baichuan 2的訓練細節(jié),IT之家附Baichuan 2下載地址:https://github.com/baichuan-inc/Baichuan2
據(jù)百川智能官方介紹,Baichuan2-7B-base和Baichuan2-13B-base,均基于2.6萬億高質量多語言數(shù)據(jù)進行訓練,兩個模型在數(shù)學、代碼、安全、邏輯推理、語義理解等能力有顯著提升。
其中Baichuan2-13B-base相比上一代13B模型,數(shù)學能力提升49%,代碼能力提升46%,安全能力提升37%,邏輯推理能力提升25%,語義理解能力提升15%。

▲圖源“百川智能”公眾號,下同
在MMLU、CMMLU、GSM8K等基準測試中,百川智能的兩個模型都比LLaMA 2的分數(shù)要高一些,且在“中文通用”部分優(yōu)勢較大。
Baichuan2-7B和Baichuan2-13B不僅對學術研究完全開放,開發(fā)者也僅需郵件申請獲得官方商用許可后,即可以免費商用。騰訊云、阿里云、火山方舟、華為、聯(lián)發(fā)科等企業(yè)均參加了本次發(fā)布會并與百川智能達成了合作。