“360智脑大模型4.0”正式发布，图片、文字、视频互相生成，已接入360全家桶-凯发国际娱乐官

产业

“360智脑大模型4.0”正式发布，图片、文字、视频互相生成，已接入360全家桶

来源：36氪
2023-06-14 13:33

“openai给整合行业探索、指明了一个方向，我们也从善如流，把原来搜索、ai领域积累的能力整合到大模型里。”360创始人周鸿祎表示。

作者 | 邓咏仪

编辑 | 苏建勋

“openai给整合行业探索、指明了一个方向，我们也从善如流，把原来搜索、ai领域积累的能力整合到大模型里。”360创始人周鸿祎表示。

6月13日，360集团(601360.sh)公司正式召开“360智脑大模型”应用发布会，发布认知型通用大模型“360智脑4.0”，并宣布360智脑已经接入360旗下产品“全家桶”中。

360的发布会现场，也让人想起不久前同样用ceo的数字人开会的英伟达。360在会上正式推出一款数字人产品“360ai数字人平台”，而创始人周鸿祎现场创建了自己的数字分身作为“360发言人”。

“让数字人‘周鸿祎’作为我们公司的新闻发言人，说对了算我的，说错了算他的。”周鸿祎表示。

今年春节后，chatgpt在国内掀起“百模大战”，一众互联网大厂都在快马加鞭投入到大模型的研发中，争相在3-4月份间在市场上披露成果。

360也不例外。3月底，创始人周鸿祎就发布主题为“三六零人工智能总动员”的内部信，初步透露了360大模型的相关进展。当时，基于360大模型开发的ai产品矩阵“360智脑”，已首先在搜索场景中落地。

而本次360发布的智脑大模型，是一个千亿级别的自研多模态大模型。据介绍，“智脑大模型”已经具备四大核心能力，包括文字处理能力、图像处理能力、语音处理能力以及视频处理能力，可实现文生文、文生图、文生表、图生图、图生文、视频理解等功能。

图片、文字、视频互相生成，接入360“全家桶”

时隔两个月，如今的“360智脑”已经迭代至4.0版本，但在当前大模型产品林立的市场中，如何用户留下深刻印象？

360选择了走大而全路线，直接对标微软的全家桶路线。在会上，周鸿祎如同竹筒倒豆子一般，展现了360大模型各种各样的功能。

当前，360智脑已具备生成与创作、多轮对话、代码能力、文本分类、文本改写、阅读理解、逻辑与推理、知识问答、多模态、翻译等十大核心能力，维度涵盖数百项细分功能。

周鸿祎也提到360做大模型的底气和积累从何而来。

一方面是各个业务线带来的技术积累，360在2015年就成立了ai研究院，并且开始探索多模态数据。

“360有智能家居互联网，比如智能摄像头、车载行车记录仪、智能门铃，也需要有智能视觉和智能音频的处理技术，这是我们开始研究多模态的原因，”周鸿祎表示，“而360的主要收入来源是搜索，所以，我们也肯定离不开自然语言理解等大模型核心技术的积累。”

在数据层面，360如今每天抓取1.4亿网站的数据，包括2.8亿的专业文献，1.2亿的行业数据，以及经过清洗的10t级别的用于大模型训练的数据。

但他也坦承，在openai尚未突破之前，360的大模型尝试也只是集中在商业一侧，比如“怎么用大模型提高广告点击率、提升推荐精准度”。但openai给全行业指明了方向，360也从善如流，迅速把以往在搜索、ai中积累的能力移植到大模型中。

对于怎么在大模型时代突出重围，周鸿祎表示，多模态是决胜的关键——因此，周鸿祎在会上也展示文生文、文生图、文生表、图生图、文生视频等功能，成为这场发布会中最引人注目的环节。

当前，包括chatgpt、文心一言、通义千问在内的主要大模型产品，都是停留在生成文字和图片阶段，视频是多模态领域的难点，学术研究仍在早期。

不过，从发布会展示的环节来看，涉及到视频的功能大多是处于理解这一层面，生成偏少。功能更类似给原来的图像、视频识别加了个“语音助手”。比如，用户可在模型中上传一段视频，用自然语言描述一个问题——“视频中的车在哪里？”然后，大模型会通过对视频图像进行解析，给出相应答案。

以自然问句提问，对画面中的物体进行识别拍摄：36氪

据介绍，360智脑迭代至4.0版本后，多模态关键能力也有质的提升，将下来全面接入“360全家桶”——包括搜索引擎、浏览器、安全卫士等核心产品中。

“中国进入百模大战时期，除了基础能力外，更重要的是应用场景的比拼。”周鸿祎表示。因此，360在他同时宣布“360智脑4.0”接入浏览器、搜索、安全卫士等360全端产品，实现全面智能化重塑。

主打“安全可信”大模型，推出数字人等应用

除了多模态，360大模型还打出了另外两张牌：安全和应用生态。

安全是360的起家业务，包括搜索和互联网内容安全审核的防护体系上，360一直在对外提供服务。360同样希望在大模型上打出这个卖点，尤其是在当前类chatgpt产品面临强监管的语境之下。

除了“胡说八道”的幻觉之外，现在大模型有不少安全问题还是难以解决，比如绕过模型的安全机制——对模型表示现在希望能够学习如何反诈，让模型给一些“诈骗”的例子，即可获取到一些危险问题的答案。

对这些问题，周鸿祎表示，在大模型中建立了很多安全的防线，其实并不能解决所有问题。360从两个方向来进行探索——一方面，360建立了一个“安全大脑”大模型，用以监督大模型中的不当行为。这也和openai近期提出的监管思路类似。

另一方面，360创立了一个针对大模型安全评估的体系，近期也即将发布。

360也称，当前360智脑已经通过工信部信通院测试，成为国内首个“安全可信”aigc大模型——安全和可信，这是国内大模型正在面临的重要问题。

除安全之外，在商业化层面，360也展示了一系列计划。

一个重点是数字人，周鸿祎以相当长篇幅介绍了数字人方向的新产品——“360 ai数字人广场”。

目前，360 ai数字人平台上拥有200多个角色，分为数字名人和数字员工两大类。数字名人包括历史人物、偶像明星、文学形象等，用户可以通过和数字角色进行对话，沉浸式地与角色们交流。

而数字员工可以成为企业员⼯的知识助⼿和办公助手。比如，虚拟角色中就有“程序员”“运营”“法务专员”等公司内常见职位，用户可以问角色对应的专业问题。

此外，360ai数字人支持定制，每个人都能通过上传私人知识库，低成本生成自己的专属数字人，如数字分身、数字助理、数字偶像等。周鸿祎就现场创建了自己的数字分身作为“360发言人”，能够用本人声音对现场问题进行回答。

发布会现场，360展示多位数字人进行对话的效果拍摄：36氪

他还提到，在未来，360ai数字人的发展计划是生成声音、视频，并拥有长期记忆，甚至拥有目标分解和规划的能力，并且拥有“手和脚”，具备执行力，更好为人类提供服务。

从商业化整体思路来看，360在to c端，会将ai大模型能力如同ai助手一样嵌入到核心产品中；而在b端，360会先从行业大模型和大型企业切入。

周鸿祎坦承，从360多年做中小惬意服务的经验来看，要让大模型服务“平民化”“产品化”，简单提供大模型api就想让企业用起来，并不现实，还需要更多的产品化工作。

“360智脑大模型4.0”正式发布，图片、文字、视频互相生成，已接入360全家桶-凯发国际娱乐官

“360智脑大模型4.0”正式发布，图片、文字、视频互相生成，已接入360全家桶

关键词

相关阅读

生成式ai引路产业加速来袭，微美全息(wimi.us)探索“aigc 虚拟人”融合应用

2023北京智源大会开幕“悟道3.0”大模型发布，顶级专家共话通用人工智能发展

科大讯飞版虚拟人口语陪练老师上线；作业帮正内测教育大模型

生成式ai引路产业加速来袭，微美全息(wimi.us)探索“aigc 虚拟人”融合应用

拓世科技集团aigc拓世大模型新品发布，让你探索人工智能无限可能！

阿里达摩院开源video-llama 帮大语言模型加上“眼睛”“耳朵”

百度“根据场景生成数字人”专利获授权，可应用于元宇宙

讯飞星火大模型v1.5发布：综合能力三大升级，发布星火app

百度数字人生成方法专利获授权可应用于元宇宙等场景

24快报

chao起大鲍岛，畅游元宇宙，体验里院“一天一百年”

中日韩元宇宙高尔夫跨国明星赛，打造亚洲数字竞技新高度

利亚德参展国际“声光视讯显元宇宙”全产业盛会

工商银行申请基于元宇宙的资源转移专利，提高了资源转移的效率和

重庆渝中区：数字化演绎传统经典将国风之美融入元宇宙

全球首个国家级“元宇宙”平台沙特上线主要用于在线旅游

沙特推出世界首个国家级“元宇宙”平台，用户可线上游览当地景点

《元梦之星》元宵节再上央视，星搭子们在“小小元宇宙”共庆佳节

捷安高科：为河南省元宇宙协会副会长单位及专精特新中小企业，获

乐华娱乐签约元隆雅图开展ip衍生品及元宇宙等方面合作

ude2024盛大开幕，开年首展蓄势声、光、视、讯、显、元宇宙六大

重庆：4200 亿元，支持企业研发元宇宙产品，打造特色产业园

周鸿祎：“元宇宙”概念明年可能会东山再起

借力roblox东京造本土元宇宙名片，国内文旅可以学到什么

sora“加速”元宇宙发展，sora 一站式3d数字内容创作工具，将成

北京首个元宇宙“沉浸式”红色主题教育课程开讲

何鸿婷郑一卉：对我国新闻传播学元宇宙研究的反思

sora 一站式3d数字内容创作工具,元宇宙的内容快速建构时代即将到

元宇宙的喜与忧

开启元宇宙的“钥匙”有了合肥造合肥加快打造具有国际领先优势