南京智子引擎信息科技有限公司和南京江北新区产业技术研究创造院于10月9日签署投资协议,共同成立智子引擎全国总部。智子引擎主要从事新一代人工智能低层引擎和多模态大模型的研究、开发和商业化运营,主要应用于多模态 chatgpt 产品“元乘象 ChatImg”。该产品媒介数为100亿级,主要以图片、文字数据和 VQA 数据为训练集,同时进行图片、文字配对、图片、文字搜索、图像说明生成、文本说明生成等多种训练。 研究创始员认为,多模态大模型与成功探索路径的大型语言模型相比,仍接近于“无人区域”。因此,该工程竣工后,双方还将共同建立一个生态应用中心、一个山力中心和中国人民大学共同建设大型模型联合实验室。该发动机将在年内推出元乘象昇腾版本,并以昇腾技术为基础持续发展。 智子引擎是中国较早开始多模态大型模型研究的团队,依靠中国人民大学人工智能学院的技术力量,进行大型模型的相关研究成果和商业化。2021年3月,智子引擎推出了多模式“文澜BriVL”,并推出了2.0版本。2023年3月,规模150亿个参数的多重“元乘象 ChatImg”应用程序公开了。此次发布的版本2.0是多模态对话数据集(llava)公开评价过程中对中国-英语双语多模态对话功能的提升。相比主要开源模式,该产品的性能有显著提升。 8月24日,智子引擎宣布完成数千万元天使+首轮融资。本次融资由中金资本下属基金和某投资机构共同主导,并在软通高科等各方面共同投资。今年5月22日,智子引擎刚刚完成天使轮融资。
智子引擎成立于2021年,是国内首个做多模态大模型的团队,在多模态方向上与OpenAI两次并跑。公司致力于让AI理解世界、与世界交流,最终更好地服务人类。公司拥有完全自主研发的AI体系,技术上已经实现文生文、文生图、图生文、图生图、文生视频、视频生文等多模态全方位的智慧交互能力。目前公司发布的元乘象Chatimg3.0是一个超精细识别、少幻觉的多模态大模型,同时支持多图理解、物体定位、OCR等功能,在问答和业务两个方面的能力上赶超GPT-4V,表现出优秀的发展潜力。 目前智子引擎已经将“元乘象Chatimg3.0”应用于全域防控和无人机巡检等领域,通过与无人机、电子探头等前端感知设备的融合,升级传统巡检和安防,实现了AI缺陷识别、异常检测、行为分析、重点监控、风险预测等功能。产品将被快速应用于城市治理、智慧电力、管道巡检等多行业应用场景。 我们团队起源于中国人民大学高瓴人工智能学院,团队曾主导了国内首个多模态大模型项目悟道·文澜,团队成员多来自于互联网大厂,拥有多年的技术研发、管理运营和市场推广经验,在人工智能领域具备一定的经验积累和独到的知识见解,为智子引擎快速发展和崛起奠定了人才基础。