2023年4月18日,全球化移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”,以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”
2023年4月18日,全球化移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”,以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。
地址 ; https://www.apusai.com/
作为一家成立近九年的全球化系统服务商,APUS是最早感受到ChatGPT引发的技术浪潮的一波企业。彼时,APUS已完成了从“出海”到“全球化”的战略更迭,大模型则是公司找到的“第二曲线”。
“训练APUS累计花了将近1000万美金。”APUS创始人兼CEO李涛透露。APUS技术专家张旭在发布会上也展示了关于AiLMe的多个技术细节:
在算法架构上,AiLMe与GPT一样,基于的是Transformer架构,同时模型还引入了扩散模型来生成图像等多媒体内容,构建了多模态交互的生态;在数据层面,AiLMe的训练数据主要来源于互联网公开语料库、互联网公开网页数据、APUS在服务中积累的产品数据和行业数据四个渠道;在算力层面,APUS在郑州和新加坡分别搭建了几千台服务器,为AiLMe的训练和推理提供充足的算力。
缓解“算力焦虑”,这是AiLMe技术路径带给行业的启示。张旭告诉36氪,AiLMe在训练过程中并未一味地扩张参数,而是选了使用更多的数据来训练这条路:“一是对于APUS这样的中型企业而言,成本控制很重要,二是用更大规模、更高质量的数据来训练,可以用千亿的参数规模接近更大体量模型的效果。”
天燕大模型的发布或许也意味着,APUS在由AI掀起的技术革命浪潮中,将自己重新定位在了模型层。
在上一轮互联网浪潮中,APUS瞄准的是底层系统赛道。李涛在发布会上表示,和系统赛道一样,目前做底层大模型的公司将会经历从百花齐放,到收敛为个位数家企业的“寡头”局面,“在未来,真正好用的模型会留下,而基于模型做应用的公司将百花齐放”。
在商业化层面,与多数大模型企业先toB开放API以积累行业数据,再做toC应用的路径不同,APUS先基于AiLMe,推出了问答大师、简笔成画、墨染等7款涵盖“文生文”“图生图”“文生图”等多模态交互的AI消费端产品。
粉丝
0
关注
0
收藏
0