BigBang Transformer[乾元]是基于GPT Decoder-only架构的大规模预训练模型。继2022年开源BBT-1-0.2B模型之后,我们正式开源最新系列的BBT模型:BBT-1-1B,BBT-2-12B-Text,BBT-2.5-13B-Text。预训练语料库覆盖14个高质量数据源,覆盖书籍、百科、论文、小说、新闻、政策文件、中文博客、社交媒体等多个数据源种类。BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。
模型开源后所有开发者可以:
1. 可以直接调用大模型进行对话
2. 在我们训练的基础上使用自由语料库继续训练
3. 对大模型进行微调训练以满足各种下游任务
类似的工具
K2-上海交通大学
一个地球科学的开源大预言模型
讯飞星火认知大模型
免费使用-AI写作、AI百科、AI问答
CodeFuse
蚂蚁自研智能研发助手
SparkDesk讯飞星火认知大模型
从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
阅文妙笔大模型
全面探索有声、漫画、动画、衍生等开发链条的AI应用。
BenTsao本草
中文医学知识的大语言模型
其他人也看的工具
AmyMind
AmyMind伴你思考的AI思维导图
ProteinQure
尽管它们具有固有的优势,但设计基于蛋白质的疗法非常困难。由于蛋白质的尺寸较大和缺乏可用的结构数据,计算工具以前一直受阻。我们利用基于物理的方法和新颖的机器学习算法来克服这些挑战。
Neuroflash
Neuroflash允许其用户通过消...
Lunit
Lunit是一家上市公司,开发有助于征服癌症的医疗AI软件。对于癌症,生存通常取决于它被发现的早期程度,而Lunit的癌症筛查AI帮助医生更早地发现它。
FutureTools未来工具
FutureTools 收集并整理了所有最好的 AI 工具,让你也能成为超人!
Profluent.bio
领导蛋白质设计,用AI 解码蛋白质的语言。设计新颖、最佳的蛋白质,绕过行业中现有的障碍。
AI 中文社
