来和“商量”商量一下!商汤自研大语言模型“商量SenseChat”即日起向社会开放

2023-08-31 14:31:22    来源:新民晚报


(资料图)

图说:商汤“商量”正式面向社会开放 采访对象供图(下同)

商量商量,都能解决。

记者今天中午从商汤科技获悉,商汤“日日新”大模型旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。市民可通过SenseChat官网注册使用(https://chat.sensetime.com)。

商汤“商量SenseChat”今年4月首次推出,是国内最早的基于千亿参数大语言模型的聊天机器人产品之一,拥有领先的语义理解、多轮对话、知识掌握、逻辑推理的综合能力。“商量”最新基模型书生·浦语InternLM-123B由商汤联合多家国内顶级科研机构发布,拥有1230亿参数,在语言、知识、理解、推理和学科五大能力上均处于行业领先水平。8月,在全球51个知名评测集共计30万道问题集合测试中,InternLM-123B整体排名全球第二,其中在12项主要评测中超越GPT-4排名第一。

图说:“商量”网页操作界面

记者了解到,作为商汤自研的千亿参数大语言模型,“商量SenseChat”庞大的参数规模,保证了在内容生成、知识理解等方面具备强大的能力。当需要处理大量文档,如各类文章、报告、信函、产品信息、IT信息等,“商量”可以帮助对文档进行编辑、重写、总结、分类、提取结构化信息等。

此外,“商量”可以扮演不同的角色,从银行客服到绘本老师,都能自然称职地完成给定角色的任务。同时,“商量”还涌现出了相当的逻辑推演与智能能力,不仅能理解人的语言,还可以让生成的内容更合乎逻辑、更加合理。

值得一提的是,“商量”的基础模型是基于数以万亿计的多语种高质量数据集训练而成,覆盖领域广泛。其对各领域知识的理解兼具广度和深度,在医疗、金融、移动终端、代码开发、企业服务、城市管理、汽车出行、教育等垂直领域都有不俗的表现。“商量”更具备了实时信息更新的功能,可为用户提供更优质的服务。

据介绍,商汤在原始语料数据的积累,以及对语料进行清洗和试验的能力上处于行业领先。目前每月可产出约2万亿token的高质量数据,预计年底高质量数据储备将突破10万亿token。同时,商汤还投入了数百台服务器搭载千卡GPU的计算资源,采用算法结合人工的方法对原始语料数据进行分门别类的精细化清洗,以确保数据的质量、安全性和价值观都符合要求。

新民晚报记者 郜阳

标签:

X 关闭

X 关闭