IDEA研究院讲席科学家张家兴:中文世界需要有中国文化内核的AIGC模型财专访半岛APP
发布时间:2023-09-04
 半岛APP(原标题:IDEA研究院讲席科学家张家兴:中文世界需要有中国文化内核的AIGC模型财专访)  《安安访谈录》是界面财联社执行总裁徐安安出品的一档深度访谈类栏目。从投资角度对线位行业领军人物,覆盖传媒创新、VC/PE、信息服务、金融科技、交易体系、战略新兴等方向。  《财专访》是由《安安访谈录》出品的系列专访,财联社上市公司报道部聚焦行业热点,通过专访各类专家、领军人物,致力寻找投资价

  半岛APP(原标题:IDEA研究院讲席科学家张家兴:中文世界需要有中国文化内核的AIGC模型财专访)

  《安安访谈录》是界面财联社执行总裁徐安安出品的一档深度访谈类栏目。从投资角度对线位行业领军人物,覆盖传媒创新、VC/PE、信息服务、金融科技、交易体系、战略新兴等方向。

  《财专访》是由《安安访谈录》出品的系列专访,财联社上市公司报道部聚焦行业热点,通过专访各类专家、领军人物,致力寻找投资价值标的,还原行业发展逻辑。

  “中文世界需要有中国文化内核的AIGC模型,行业发展还需要有更多的AIGC产品创新出现,传统产品都值得用AIGC做一次升级。”

  现任IDEA研究院讲席科学家,认知计算与自然语言研究中心负责人;曾任微软亚洲研究院研究员、蚂蚁金服资深算法专家、360数科首席科学家。

  粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称“IDEA研究院”)成立于2020年,目前已聚集包括院士、世界著名大学教授、世界知名开源系统发明人在内的国际一流技术专家,致力于在AI基础技术与开源系统、人工智能金融科技、区块链技术与机密计算、企业级AI系统、产业智能物联网与智能机器人等领域研发国际顶尖成果,并培育一批国际领先科技企业,带动深圳乃至大湾区万亿级数字经济产业发展。

  IDEA研究院认知计算与自然语言研究中心(Cognitive Computing and Natural Language,CCNL)致力于推动预训练大模型为代表的新一代认知与自然语言基础前沿技术的进一步发展,力图解决大模型实际落地过程中的全部技术问题,构建对话机器人、知识抽取、知识体系等自然语言领域的新的技术架构,打造认知人工智能的新技术范式。

  AIGC正成为继PGC和UGC之后的全新内容创作模式,底层模型能力突破带来的行业应用潜力初现。在AI绘画这一技术应用分支,受海外Stability AI公司开源Stable Diffusion模型推动,行业准入门槛大幅降低,AI绘画的产业化和商业化进程加速。

  由此可见,在AIGC行业发展初期,底层模型的迭代、开源将成为重要的核心推动力。基于此,CCNL于今年11月1日正式开源了自主研发的首个中文Stable Diffusion模型“太乙”,旨在更好地助力中国AIGC文化产业数字化转型的创新发展。

  IDEA研究院讲席科学家张家兴在接受财联社记者专访时表示,中国并不缺乏产品创新者,当下欠缺的是AIGC底层能力的提供者。“我们团队希望在中国的AIGC产业里,承担Open AI跟Stability AI这样的角色,不断迭代底层模型能力,助力上层出现更多的产品创新,服务于更广泛的用户。”

  之所以选择推出“太乙”,张家兴表示,一方面因为英文模型会产生翻译损耗、难以生成具有中国文化内核的图片。另一方面Stable Diffusion模型已经在英文世界中证明了自己的价值,即极大降低了AIGC行业门槛,中文世界同样需要一个“原汁原味”的Stable Diffusion模型去推动整个产业发展。

  对于AI来说,“投喂”什么样的数据会直接决定学习结果。例如,在英文Stable Diffusion模型中输入“宫殿”关键词,由于系统默认为英文思维,故输出的也是西方类型的各式宫殿图片。而在“太乙”中输入“宫殿”,生成的则是具有中国特色的宫殿建筑。输入人像、古诗类描述词也是同样的道理。

  张家兴透露,“太乙”的训练数据量超过了1亿对的中文的图文对。“我们已经把整个团队都投入进去了,几十个成员基本都是在围绕着AIGC模型研究实践,也希望做一些更贴近下游应用的AIGC模型。”

  实际上,目前Stable Diffusion模型技术并不完美。一个最明显的不足点是,当图片为照片风格时,人脸生成和人手的生成质量较差。为此,“太乙”加入了图像编辑功能,用户可以对一张图片的人脸部分进行单独修复,这是原版Stable Diffusion模型无法支持的。

  在整个AIGC行业,“太乙”作为底层模型,为应用层提供技术支撑。张家兴表示,推出“太乙”只是CCNL在AIGC方向上走出的第一步,后续团队将从三个层面持续发力。

  一是不断进行模型迭代,对模型结构进行创新、构建质量越来越高的数据集等,完善最基础最底层的AIGC模型。目前CCNL已经开源了88个预训练模型,整体称为“封神榜”是目前中国最大的预训练模型开源体系。

  二是推出针对特定领域的AIGC模型,例如二次元、科幻、游戏等领域。张家兴认为,一个通用的AIGC模型很难在所有领域上都表现出色,而与各垂直行业业内公司合作,有助于一同推出更多精准的模型工具。

  三是通过API(Application Program Interface,应用程序界面)将模型接入更多的业务场景。“太乙”团队目前已经推出了API功能,免费提供给用户,每人每天有1万的调用额度。“这足以支持一个小团队前期去做产品创新,在特定领域面向特定用户的公司,往往有自己独特的经验和产品上的想法。这个时候可以直接调用我们的API构建产品,如果后期试验的比较成功了,我们可以再进一步探讨如何做一些针对产品的定制化的模型。”张家兴表示。

  当前阶段,“太乙”已经在推进一些生态合作,对象主要瞄准在数据和场景上有优势的公司,CCNL提供模型技术支持,对方公司则专注于产品运营,双方形成优势互补关系。

  “一种是对方的产品已经跑在前面了,但急需技术升级,以及更好的 AIGC模型内核。另一种是对方本身有很强的数据图像方面的优势,通过‘太乙’技术赋予数据新的价值。因为有的数据是有版权的,有一定获取成本,现在用AIGC的方式给业务数据再进行一次大规模的扩充,这样他们就有了更多自有版权了,并且基本是零成本。”张家兴表示。

  张家兴透露,目前团队也在跟一些在图片数据上非常有优势的头部公司商议,推出一些商业版的模型,能够生成更高分辨率更高清晰度更写线

  AIGC被业界广泛视为解放未来生产力的工具,与“降本增效”紧密挂钩。在张家兴看来,AIGC改变的更多是生产方式。“现在AI生成一张图片基本上1秒钟就够了,就算需要人工筛选也只需要几分钟。但过去如果是纯人工生成,可能以天为基数。”在AI的加持下,人在创作过程中更多是提供创意,以及筛选和挑选,颠覆了以往的生产方式。

  张家兴认为,“降本增效”并不是AIGC真正的潜力。“降本增效只是任何一个技术刚出来时,大家都会关注的点。但时间久了,让这个技术真正被大家广泛使用,成为社会底层的支撑性技术,都是因为它支持了一些新的产品甚至新的产业,这才是它真正的价值。”

  张家兴表示,中国不缺乏做产品创新的人,但现在缺少AIGC底层能力的提供者。“海外比如Open AI和Stability AI两家公司,对整个AIGC产业提供基础设施。国内这方面目前比较欠缺,至今没有这样的一个商业公司出现。”

  “这就造成一个问题,每个想做AIGC的公司从模型到产品都要考虑在内,但前期的资源往往有限,可能更多为了保证产品效果,在底层模型研发上投入不了那么多的精力,也不可能投入像Open AI和Stability AI那么大的资源,基本上是对模型进行一些微调,然后就上线了,这样其实会存在大量问题。”张家兴表示。

  张家兴透露,目前部分推出AIGC产品的公司已经大体实现收支平衡,头部产品已经有很大的用户体量和日调用量。“但其实还需要有更多AIGC的产品和落地场景出现,包括一些传统场景,比如图片搜索和图库,值得全部做一次升级。”

  至于眼前的机会,张家兴表示,明年最值得期待的是视频和3D功能突破。“目前两方面还处于初级阶段,类似于两年前的图像生成。而人工视频的制作成本要比图片成本高,但对于AI来说区别不大,如果有AIGC技术在这些方面大幅度应用的话,会产生更大的商业价值。”

  中信保诚人寿保险有限公司副总经理、资深精算师:崔巍(资深精算师,保险产品开发、营销领域专家)

  康菲中国总裁威诺德(Bill Arnold)(油气行业低碳发展的探路者)

  财通资管权益私募投资部总经理:陈李(专户老将,不断进阶的“实业派”高手)

  诺德基金董事长:潘福祥(进入证券业最早的投资学老师,教授投资学时间最长的证券从业者)

  兴业基金固定收益董事总经理、投资总监:周鸣(大类资产配置与跨市场多资产投资专家)

  沐曦联合创始人、CTO兼首席软件架构师:杨建(高性能国产GPU的开拓者)

  亿铸科技创始人、董事长兼CEO:熊大鹏(存算一体 AI 大算力芯片的开拓者)

  英特尔大数据技术全球首席技术官:戴金权(大数据分析和人工智能技术专家)

  富途董事总经理、国际化战略及财富管理负责人:曾煜超(科技券商依托互联网开拓财富管理业务的探索者)

  华泰金控董事总经理兼张乐通全球负责人:朱亚莉(中资券商APP国际化探索者)

  华福证券首席信息官、零售业务条线事业部总裁:王俊兴(精通金融与IT的券业先锋)

  申万宏源证券固定收益融资总部总经理:范为(宏观经济与资本市场资深专家)

  招商证券总裁助理、投资银行委员会主任委员:王治鉴(亲历创业板注册制改革的投资银行家)

  中金公司投资银行部负责人:王曙光(见证与建言资本市场改革发展的资深投行家)

  中金公司研究部固收研究负责人、董事总经理:陈健恒(宏观经济及债券投资策略分析专家)

  中信建投证券执委委员、投资银行业务管理委员会主任:刘乃生(制度建设的投行亲历者、建言者)

  国家信息中心预测部产业室主任:魏琪嘉(国家发改委系统、产业经济领域专家)

  国务院发展研究中心宏观经济研究部研究员:张立群(国务院发展研究中心宏观经济研究部研究员)

  中国宏观经济研究院对外经济研究所研究员:杨长湧(国家发改委系统、宏观经济领域外贸专家)

  中国宏观经济研究院决策咨询部研究员:盛朝迅(国家发改委系统、产业经济领域专家)

  八爪鱼&云听CEM创始人:刘宝强(国内首个客户体验管理SaaS平台开创者)

  观远数据创始人兼CEO:苏春园(引领数据智能行业长远创新的长期主义者)

  数说故事创始人&CEO:徐亚波(行业领先的大数据AI独角兽企业“掌门人”)

  威尔森创始人&CEO:梁维新(行业领先的汽车数据信息综合应用平台“掌舵人”)

  IDEA研究院讲席科学家:张家兴(AIGC底层技术研究和实践的领军者)

  共达地CMO:李苏南(行业首个商用AutoML自动化AI训练平台布道者)

  深兰科技创始人:陈海波(坚持基础研究和应用开发并重的人工智能“深耕者”)

  小i集团创始人、董事长兼CEO:袁辉(中国认知智能及元宇宙领域领军人物)

  云从科技联合创始人、战略规划部负责人:姚志强(人机协同操作系统的先行者)

  复旦大学绿色金融研究中心执行主任:李志青(绿色经济金融的研究者,绿色转型发展的助推者)

  中国社会科学院生态文明研究所副所长:庄贵阳(中国低碳经济研究的先行者)

  中国政法大学民商经济法学院副院长:于文轩(专注生态环境法治的研究者和推动者)

  东方引擎合伙人、副总经理:李慧鹏(连续多年保持优秀投资业绩的债券金牛基金经理)

  深高投资创始合伙人/CIO:李凯(中国首批高收益债投资人、企业信用风险分析专家)

  盈米基金副总裁、盈米基金研究院院长:杨媛春(多资产配置、FOF投研专家)

  建信信托副总裁:王业强(建信信托,股权投资支持科技创新的先行者与探索者)

  华天软件董事长:杨超英(国内首套机械CAD创立者,工业软件领域领跑人)

  山石网科董事长:罗东平(网络安全领域早期海归工程师、科创板公司创始人)

  BrainCo强脑科技创始人:韩璧丞(Neuralink中国首位挑战者)

  锘崴科技创始人、董事长:王爽(基于隐私计算构建国家级医疗健康网络的实践者)

  睿心医疗合伙人&COO:刘晓扬(心脑血管诊疗一体化的软硬件生态平台先行者)

  沃比医疗CEO:安穆克(Michael Alper)(神经介入领域出海的先行者)

  药明奥测首席科学官兼首席技术官:方焯博士(整合诊断/人工智能赋能精准医疗的创新者)

  平安理财固定收益投资部负责人:熊珣(平安理财,银行理财领域多资产多策略配置领跑者)

  纵目科技CEO:唐锐(自动驾驶与高级驾驶辅助系统(ADAS)领域的14年研发管理老兵)

  证券之星估值分析提示申万宏源盈利能力一般,未来营收成长性较差。综合基本面各维度看,股价合理。更多

  证券之星估值分析提示贝瑞基因盈利能力良好,未来营收成长性较差。综合基本面各维度看,股价偏高。更多

  证券之星估值分析提示黑芝麻盈利能力一般,未来营收成长性较差。综合基本面各维度看,股价偏高。更多

  证券之星估值分析提示国海证券盈利能力较差,未来营收成长性一般。综合基本面各维度看,股价合理。更多

  证券之星估值分析提示协鑫能科盈利能力一般,未来营收成长性一般。综合基本面各维度看,股价合理。更多

  证券之星估值分析提示科大讯飞盈利能力一般,未来营收成长性一般。综合基本面各维度看,股价偏高。更多

  证券之星估值分析提示多氟多盈利能力一般,未来营收成长性较差。综合基本面各维度看,股价偏低。更多

  证券之星估值分析提示国信证券盈利能力良好,未来营收成长性一般。综合基本面各维度看,股价偏低。更多

  以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至,我们将安排核实处理。