阿帕斯大模型

发表于AI大模型版块教程,交流

2023年4月18日，全球化移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”，以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”

2023年4月18日，全球化移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”，以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。

地址 ; https://www.apusai.com/

作为一家成立近九年的全球化系统服务商，APUS是最早感受到ChatGPT引发的技术浪潮的一波企业。彼时，APUS已完成了从“出海”到“全球化”的战略更迭，大模型则是公司找到的“第二曲线”。
“训练APUS累计花了将近1000万美金。”APUS创始人兼CEO李涛透露。APUS技术专家张旭在发布会上也展示了关于AiLMe的多个技术细节：
在算法架构上，AiLMe与GPT一样，基于的是Transformer架构，同时模型还引入了扩散模型来生成图像等多媒体内容，构建了多模态交互的生态；在数据层面，AiLMe的训练数据主要来源于互联网公开语料库、互联网公开网页数据、APUS在服务中积累的产品数据和行业数据四个渠道；在算力层面，APUS在郑州和新加坡分别搭建了几千台服务器，为AiLMe的训练和推理提供充足的算力。
缓解“算力焦虑”，这是AiLMe技术路径带给行业的启示。张旭告诉36氪，AiLMe在训练过程中并未一味地扩张参数，而是选了使用更多的数据来训练这条路：“一是对于APUS这样的中型企业而言，成本控制很重要，二是用更大规模、更高质量的数据来训练，可以用千亿的参数规模接近更大体量模型的效果。”
天燕大模型的发布或许也意味着，APUS在由AI掀起的技术革命浪潮中，将自己重新定位在了模型层。
在上一轮互联网浪潮中，APUS瞄准的是底层系统赛道。李涛在发布会上表示，和系统赛道一样，目前做底层大模型的公司将会经历从百花齐放，到收敛为个位数家企业的“寡头”局面，“在未来，真正好用的模型会留下，而基于模型做应用的公司将百花齐放”。
在商业化层面，与多数大模型企业先toB开放API以积累行业数据，再做toC应用的路径不同，APUS先基于AiLMe，推出了问答大师、简笔成画、墨染等7款涵盖“文生文”“图生图”“文生图”等多模态交互的AI消费端产品。

文章说明:

本文原创发布于探乎站长论坛，未经许可，禁止转载。

题图来自Unsplash，基于CC0协议。

该文观点仅代表作者本人，探乎站长论坛平台仅提供信息存储空间服务。