一周AIGC丨 国内首个服装丝绸行业大模型发布, Pika 上线付费计划
在“智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会”上,无界 AI 与万事利丝绸共同宣布推出丝绸行业首个实用图形 AI 大模型——万事利花型大模型,基于万事利花型大模型的 AI 绘画小程序——“灵画”正式上线。文生视频软件 Pika 上线 Pika 1.0 付费计划,包括标准和专业两个档次,分别是 10 美元和 60 美元。
融资
AI 公司“斑头雁智能科技”获亿元融资,原钉钉副总裁创业杀入 AI Agent 赛道
据 36 氪 1 月 3 日报道,人工智能公司“斑头雁智能科技”近日完成近千万美元 A 轮融资,用于继续深入打造企业级 AI Agent(人工智能代理)产品 BetterYeah AI。斑头雁智能科技目前累计完成 2 轮融资,融资额合计人民币 1 亿元。斑头雁智能科技在杭州注册成立已有两年时间,由钉钉创始团队成员、原副总裁张毅(花名陶钧)创立。
中科融合完成数千万元战略轮融资,专注于自主研发的 AI+3D 芯片和模组产品
据《科创板日报》1 月 8 日报道,中科融合宣布已于 2023 年底完成数千万元战略轮融资,本轮融资由老股东万讯自控及海南明沣等联合投资,华兴资本担任财务顾问。中科融合为中国科学院苏州纳米技术与纳米仿生研究所孵化企业,其在智能光学传感领域持续追求科技创新,专注于完全自主研发的 AI+3D 芯片和模组产品,构建从“MEMS 芯片 + AI 算法 + SOC 芯片”的闭环技术链路。
英国公司 Robin AI 完成 2.6 亿美元 B 轮融资,由淡马锡领投
据站长之家 1 月 4 日报道,英国公司 Robin AI 成功完成 B 轮融资,筹得 2.6 亿美元,总融资额接近 4.3 亿美元。该公司致力于开发基于人工智能的法律合同解决方案,并通过其独特的技术,成功吸引了新加坡淡马锡控股有限公司领投的这一轮融资。
Perplexity AI 完成 7360 万美元 B 轮融资,英伟达、贝索斯等参投
AI 新智界讯,1 月 4 日晚间,AI 搜索公司 Perplexity AI 宣布已完成 7360 万美元 B 轮融资,由 IVP 领投,参与投资者包括英伟达(NVIDIA)、亚马逊创始人杰夫・贝索斯、NEA、Bessemer、Elad Gil、前 GitHub CEO Nat Friedman、Databricks、Tobi Lutke、Guillermo Rauch、Naval Ravikant、Balaji Srinivasan。在完成本轮融资后,该公司估值达到 5.2 亿美元。
大模型
斯坦福利用维基百科训练出大模型 WikiChat,性能领先 GPT-4
据站长之家 1 月 4 日报道,斯坦福大学的研究人员利用维基百科数据训练了一个大模型,命名为 WikiChat,通过优化和改进,成功解决了大模型的幻觉问题,并在事实准确性和其他指标上表现优秀。他们的最佳模型在新的基准测试中获得了 97.3% 的事实准确性,远远超过了 GPT-4 的 66.1%。此外,WikiChat 还在相关性、信息性、自然性、非重复性和时间正确性方面领先其他模型。
Hugging Face 开发 8 亿参数文生成图模型 aMUSEd,几秒钟内可生成 AI 图像
据站长之家 1 月 5 日报道,Hugging Face 团队正试图通过一款名为 aMUSEd 的新模型加快速度,该模型可以在短短几秒钟内生成图像,比其他竞争对手如 Stable Diffusion 更快。
这款轻量级的文本到图像模型基于谷歌的 MUSE 模型,参数规模约为 8 亿。aMUSEd 可以部署在移动设备等设备上。它的速度来自于它的构建方式。aMUSEd 采用了一种称为 Masked Image Model(MIM)的架构,而不是 Stable Diffusion 和其他图像生成模型中的潜在扩散。Hugging Face 团队表示,MIM 减少了推理步骤,从而提高了模型的生成速度和可解释性。而且它的小尺寸也使得它运行速度很快。
迷你 AI 开源模型 TinyLlama 发布,占用仅为 637 MB
据站长之家 1 月 6 日报道,TinyLlama 团队发布了一款占用仅 637 MB 的高性能 AI 开源模型 TinyLlama。TinyLlama 是 Meta 开源语言模型 Llama2 的紧凑版本,该模型有着 10 亿参数,性能优越,适用于多领域的语言模型研究,其最终版本在性能上超越了现有规模相当的开源语言模型,包括 Pythia-1.4B、OPT-1.3B 和 MPT-1.3B。据悉,TinyLlama 可在边缘设备上部署,也可用于辅助大型模型的推测解码。
微软微型 LLM Phi-2 现已开源,据称性能优于谷歌 Gemini Nano
据 The Decoder 1 月 6 日报道,微软以 MIT 开源许可证发布 Phi-2。MIT 许可证允许对许可软件进行商业使用、分发、修改和私人使用。去年 12 月,微软发布 27 亿参数语言模型 Phi-2, 据称,其性能与 Google Gemini Nano 2 不相上下,甚至更胜一筹。
应用
无界 AI 与万事利联合发布国内首个服装丝绸行业大模型——万事利花型大模型
AI 新智界讯,1 月 5 日,“智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会”在杭州未来科技城召开。大会由杭州未来科技城管委会、余杭区科技局和余杭区企业(人才)综合服务中心联合指导,时戳科技主办,AI 新智界提供媒体特别支持。
大会上,无界 AI 与万事利丝绸共同宣布推出丝绸行业首个实用图形 AI 大模型——万事利花型大模型。万事利丝绸董事长李建华在发布会上表示,“万事利丝绸就是要通过 AIGC 来探索更具想象力的发展之路,我们完全有信心在人工智能时代超越西方传统奢侈大牌,让设计变得便捷、高效、充满创造力,最大限度满足消费者审美的需求。”
据万事利 AIGC 实验室主理人刘婧介绍,2023 年 5 月,无界 AI 和万事利正式达成合作,共同将 AIGC 技术应用于丝巾设计领域。本次推出的万事利花型大模型基于 50 万 + 高标准质量素材训练出 12 个不同主题的 LORA 模型,首批公布的有四个主题:“十二呈祥”、“花开乐语”、“未来新纪”和“幻影人像”,这些主题已经通过模型训练和内部封装,实现了精美的纹样设计。其余八个主题仍在制作中,包括“印象西子”、“华夏韵味”、“十二星座”、“经典丝巾”、“摩登都市”、“希腊神话”、“欧洲故事”和“异域风情”。
在发布会上,基于万事利花型大模型的 AI 绘画小程序——“灵画”正式上线,并特别推出“新年秘语”活动。目前,“灵画”小程序的内测已经启动,用户分享自己的作品还有机会参与 2w 灵豆奖池瓜分活动,为新年带来满满的的惊喜。
同花顺推出问财 HithinkGPT 大模型
AI 新智界讯,1 月 2 日,同花顺宣布推出问财 HithinkGPT 大模型。据悉,该大模型采用 transformer 的 decoder-only 架构,提供 7B、13B、30B、70B 和 130B 五种版本选择,最大允许 32k 文本输入,支持 API 接口调用、网页嵌入、共建、私有化部署等能力,并为用户提供一站式标注和评测服务。目前,问财 HithinkGPT 大模型的内测申请已经启动。此外,同花顺投顾对话机器人——同花顺问财现基于 HithinkGPT 成功升级。据介绍,这是国内金融领域首个应用大模型技术的智能投顾产品。
deepin 深度操作系统推出“看图 AI 插件”,支持设备端“图像上色”等功能
据 IT 之家 1 月 3 日报道,deepin 深度操作系统近日推出了一款“看图 AI 插件”,用户在安装后即可在设备端体验 8 种“AI 修图”功能。官方宣称这款“看图 AI 插件”在“风格转换”方面使用 DCT-Net(Domain-Calibrated Translation)模型,号称仅需利用“少量风格数据样本”,即可生成“高保真、易拓展”的图片
网易有道推出子曰教育大模型 2.0
据中国新闻网报道,1 月 3 日,网易有道在北京举行子曰教育大模型创新成果发布会,正式推出子曰教育大模型 2.0,上下文窗口扩大到 16 K,同时还发布了基于大模型研发的三大创新应用及一款智能硬件新品:AI 家庭教师“小 P 老师”,有道速读,虚拟人口语私教 Hi Echo2.0,以及有道 AI 学习机 X20。此外,网易有道还宣布将开源基于子曰教育大模型自研的 RAG 引擎“QAnything”,以便与开发者社区共享技术成果。
阿里云通义千问 App 上线免费功能“通义舞王”
据 36 氪 1 月 4 日报道,阿里云通义千问 App 上线免费功能“通义舞王”,用户在通义千问 App 内输入“通义舞王”“全民舞王”等口令后,即可进入体验页面。用户按照提示要求上传照片后,十几分钟即可生成神形兼备的舞蹈视频。目前,通义千问首批为用户提供了 12 种热门舞蹈模板。该功能背后的算法为阿里通义实验室自研视频生成模型 Animate Anyone。
钉钉个人版全量上线:内置 AI 写真/法律助手等工具
AI 新智界讯,1 月 4 日,钉钉官方宣布钉钉个人版正式全量上线,用户可点击手机或 PC 左上角个人头像进行“钉钉”和“钉钉个人版”的版本切换。
据官方介绍,钉钉个人版内置了基于通义千问的对话机器人“贾维斯”、基于通义万相的绘画机器人“缪斯”等 AI 服务,并提供预置 300 多项 Prompt 模板库的指令中心。用户可根据需求为“贾维斯”设定助教、程序员、心理健康顾问等多种角色,同时绘画机器人“缪斯”支持水彩、素描、油画、3D 卡通等多种风格的绘画。此外,该版本还增加了鹿班相机、灵动人像、涂鸦作画、法律助手等多款 AI 工具,提供 AI 写真、数字分身、AI 作画、AI 律师等服务。
美图 AI 视觉大模型 MiracleVision 今日正式上线
AI 新智界讯,1 月 5 日,美图公司自研 AI 视觉大模型 MiracleVision(奇想智能)正式上线。用户可在 MiracleVision(奇想智能)官网(miraclevision.com)和美图秀秀、WHEE 等美图旗下产品中率先体验。
据介绍,用户可前往美图秀秀体验文生图、图生图等功能,前往 WHEE 体验文生图、图生图、模型训练、局部修改、画面扩展等功能。此外,美图公司正式向行业客户、合作伙伴全面开放 MiracleVision 的模型能力,持续通过 API、SDK、SaaS、模型训练等形式,助力多场景工作流,帮助企业降本增效。
浙江财经大学一退休教授利用 AI 软件制作“数字人替身”,继续为学生授课
据澎湃新闻报道,浙江财经大学的退休教授姚建荣研制了一个与自己“一模一样”的数字人,替代自己给学生免费授课。姚建荣曾任浙江财经大学信息技术与人工智能学院电子商务专业教授,从教近 40 年,于去年 10 月退休。他在接受采访时表示,自己虽然已经退休,但仍希望能以某种形式继续帮助同学们学习。
姚建荣介绍,他主要是通过一个人工智能软件,将视频影像输入进去,合成为一个数字技术人替身,然后再通过平台将讲课内容输入,平台可以自动生成一段讲课视频。“通过这个软件可以将教学内容自动翻译成英语、法语等多国语言,24 小时都可以授课,不需要亲自上阵录长时间的视频了。”
经过数月的研发之后,数字机器人现已具备和姚建荣一模一样的相貌和声音,能够实时为同学们解答基本的学术问题。姚建荣表示,数字人当前处于调试阶段,预计春节后正式投用。
文生视频软件 Pika 已上线 Pika 1.0 付费计划
AI 新智界讯,文生视频软件 Pika 已上线 Pika 1.0 付费计划。Pika 的付费计划分为标准和专业两个档次,分别是 10 美元和 60 美元。而在免费版本中,用户将拥有基础的 300 积分,可以生成 60 个视频。
小度推出小度学习机 K16,搭载 AI 互动大语文体系等 20 项 AI 功能
据 36 氪 1 月 8 日报道,小度推出学习机新品小度学习机 K16,官方售价为 2299 元。该产品搭载了小度新一代多模式精准学,以及基于百度文心大模型独创的 AI 互动大语文体系等 20 项 AI 功能。目前,该产品已在小度官方商城及各电商平台开启预售。
松鼠 Ai 推出教育行业首个智适应大模型
据经济观察网,1 月 5 日,在 AIAED 智适应教育大模型学术研讨会上,松鼠 Ai 正式发布国内首个教育智适应大模型,并在会上首次公开分享了应用落地大模型技术的思考与实践。
松鼠 Ai 董事长栗浩洋称,过去一年多里,众多国内外企业纷纷涉足大模型市场,并基于通用大模型开发出了一系列教育应用。然而,这些通用大模型主要是基于大语言模型,核心在于如何更好地与人交互。与此不同,智适应学习系统是一种能够将人工智能技术渗透到教学的核心环节,从根本上改变学习理念和方法的产品。
英伟达推出 AI 语音识别模型 Parakeet,号称优于 Whisper
据站长之家 1 月 8 日报道,开源对话 AI 工具包 NVIDIA NeMo 宣布推出 Parakeet ASR 模型系列,这是一系列最先进的自动语音识别(ASR)模型,能够以出色的准确性转录英语口语。
英伟达宣布推出了四个 Parakeet 模型,这些模型基于 RNN Transducer/Connectionist Temporal Classification 解码器,并且具有 0.6-1.1 亿参数。它们能够应对各种音频环境,并且在仅使用了 64000 小时的数据集进行训练后,在基准数据集上实现了出色的词错误率(WER)表现,优于以往的模型。
Meta 推 AI 视频模型 Fairy,可轻松替换视频人物、改变风格
据站长之家 1 月 8 日报道,Meta 的 GenAI 团队推出了视频到视频综合模型“Fairy”,该模型比现有模型更快,时间上更一致。研究团队展示了 Fairy 在几个应用中的表现,包括角色/物体替换,风格化和长形式视频生成。
据介绍,Fairy 使用交叉帧关注机制,确保时间上的一致性和高保真度合成。该模型可以在仅 14 秒内生成大小为 512 x384 像素、120 帧(30 fps 下的 4 秒)的视频,比以前的模型至少快 44 倍。但该模型目前在处理如雨、火灾或闪电等动态环境效果方面存在问题,这些效果要么无法很好地融入整个场景,要么会产生视觉错误。
观点
高盛首席投资官:混合人工智能和应用程序将在 2024 年成为焦点
据 ZDNet 1 月 3 日报道,高盛首席投资官 Marco Argenti 在其发布的年度展望访谈中表示,今年的人工智能领域将以“混合”人工智能和运行在大型语言模型之上的应用程序的兴起为主导。
Argenti 提到了 ChatGPT 等“基础”模型,他说:“混合人工智能就是把这些大模型作为大脑,解释提示和用户的需求,或者作为协调者,把任务分配给专门负责特定任务的多个工作模型。”Argenti 认为,除了世界上最富有的公司外,其他公司建立这样的大型项目成本太高。因此,大多数企业将满足于在自己的数据中心或云计算服务中建立较小的神经网络,并根据自己的专有数据进行训练。除了混合结构外,Argenti 认为 2024 年还将出现一类建立在基础模型之上的新型第三方应用程序。
温州大学元宇宙与人工智能研究院副院长谷雨:所谓 AIGC 杀手级应用存在出现即是王炸的可能
AI 新智界讯,1 月 5 日,“智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会”在杭州未来科技城召开。大会由杭州未来科技城管委会、余杭区科技局和余杭区企业(人才)综合服务中心联合指导,时戳科技主办,AI 新智界提供媒体特别支持。
在下午的“大潮将起,应用为王—寻找生成式 AI 的杀手级应用”圆桌论坛上,温州大学元宇宙与人工智能研究院副院长谷雨、西嘻影业商业运营中心总经理虞文杰、无界 AI 内容运营总监南山、三维家合伙人曹健、匠韵智能 CEO 修云鹏、AIGC 视觉设计师突突就生成式 AI 的杀手级应用展开了讨论。
谷雨表示,这个时代变化得非常快,出道即巅峰,不管是 ChatGPT 还是 MidJourney,还是 Stable Diffusion,这些软件一出来受众面就一下子扩大,不像以前很多软件有一个孕育期。实际上杀手级的应用,就是出来马上就有王炸的可能。南山同修云鹏也发表了类似的看法。南山认为,AI 出现的时候,已经达到了杀手级的概念,因为基本引起了所谓的第四次工业革命。修云鹏称,从日活数据及全面性来看,GPT 已经是一个杀手级应用了。虞文杰认为杀手级应用应具备强交互和强刚需这两大特点。
周鸿祎:2024 年将成为大模型应用场景之年,杀手级应用出现
据快科技消息,1 月 5 日举办的“2023 年风马牛年终秀”上,360 创始人周鸿祎呼吁 All in AI,未来最大的创新机会在大模型。周鸿祎表示,大模型已经开启新一轮工业革命,不发展是最大的不安全。
会上,周鸿祎还分享了对 2024 年大模型发展趋势的十大预测,包括:1、大模型成为数字系统标配,无处不在;2、开源大模型迎来爆发;3、“小模型”涌现,运行在更多终端;4、产业层面,大模型企业级市场将崛起,向深度化、产业化、垂直化方向发展;5、技术发展和应用层面,Agent 智能体将激发大模型潜能,成为超级生产力工具;6、同时,2024 年将成为大模型应用场景之年,杀手级应用出现;7、多模态成为大模型标配;8、文生图、文生视频等 AIGC 功能突破性增长;9、具身智能赋能人形机器人产业蓬勃发展;10、大模型将推动基础科学取得突破。
研报
《中国 AIGC 文生图产业白皮书 2023》发布:5 年内有望抵达万亿市场规模
AI 新智界讯,1 月 5 日,“智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会”在杭州未来科技城召开。大会由杭州未来科技城管委会、余杭区科技局和余杭区企业(人才)综合服务中心联合指导,时戳科技主办,AI 新智界提供媒体特别支持。在大会上,中国AIGC产业联盟高级研究员刘秋杉发布并介绍了《中国AIGC文生图产业白皮书2023》。报告由中国 AIGC 产业联盟和无界 AI 联合出品,从 AIGC 文生图发展历程、主流工具、产业实践以及规模预测等多个维度,全面揭示了中国 AIGC 文生图产业的未来。
报告指出,我国 2023 年 AI 文生图大模型市场刚刚进入建立的摸索期,尚未出现明显的商业规模。预计在 2024 年会诞生行业有影响力企业,并推动 AI 文生图赛道市值大幅度提升,但依然在百亿人民币市场规模之内。另外,到 2025 年 AI 文生图市场将正式进入商业模式成立期,并进一步推动整个市场规模突破 200 亿,从 2026 年开始进入规模增长的爆发期,并在 2027 年左右接近千亿级市场规模,而根据新兴科技行 业“飞轮效应”理论,以设计类软件、元宇宙、短视频创作者经济等行业发展速度类比推算,该赛道有望在 2029 年抵达万亿级市场规模。
IDC:2024 年生成式 AI 支出将翻倍,到 2027 年将超 1500 亿美元
据站长之家 1 月 2 日消息,据国际数据公司(IDC)的预测,2023 年全球企业在生成式人工智能(GenAI)解决方案上的投资已达 194 亿美元,预计在 2024 年将翻番。该预测还指出,包括 GenAI 软件、相关硬件和服务在内的支出将在 2027 年达到 1511 亿美元,年均增长率为 86.1%。
未来几年,IDC 预计 GenAI 的投资将经历自然发展阶段,企业将从实验阶段逐渐转向构建基础设施和训练数据模型,最终在各个领域实现技术的主流应用。
钉钉联合 IDC 发布 2024 AIGC 应用层十大趋势,预测今年全球将涌现超 5 亿新应用
AI 新智界讯,1 月 3 日,钉钉联合国际知名咨询机构 IDC 发布首份《2024 AIGC 应用层十大趋势白皮书》。随着 AIGC 技术的发展,智能化应用将呈现爆发式增长,IDC 预测,到 2024 年全球将涌现出超过 5 亿个新应用,这相当于过去 40 年间出现的应用数总和。《白皮书》指出,2024 年 AIGC 应用的十大趋势关键词涵盖应用层创新、AI Agent、专属模型、超级入口、多模态、AI 原生应用、AI 工具化、AI 普惠化等。
瑞银预计 2027 年人工智能市场规模达 2250 亿美元,平均每年增长 152%
据新浪财经报道,瑞银集团在周二发布的一份报告中表示,科技行业才刚刚开始大规模增长周期,到 2027 年,人工智能在各经济体的广泛应用将使其成为一个 2250 亿美元的市场。与 2022 年的 22 亿美元相比,这是一个巨大的飞跃,标志着近 152% 的复合年增长率。
研究:GPT-4 在儿科疾病诊断中准确率仅为 17%
据站长之家 1 月 5 日报道,发表在《美国医学会儿科杂志》上的一项研究表明,GPT-4 在儿科医学病例的诊断方面的准确率仅为 17%,较去年一般医学病例的 39% 更低。
在该项由纽约科恩儿童医学中心进行的研究中,ChatGPT-4 被用于分析自 2013 年至 2023 年间 JAMA Pediatrics 和 NEJM 发表的 100 个儿科病例。研究人员将相关病例的文本粘贴到 ChatGPT 的提示中,然后由两名合格的医学研究员对 AI 生成的答案进行评分。ChatGPT 在 100 个病例中仅有 17 个正确的诊断,72 个错误的诊断,以及 11 个未完全捕捉到诊断的情况。其中,57% 的错误诊断集中在同一器官系统。
Gartner 预测:到 2026 年全球 80% 的公司将在其业务中使用生成式 AI
据《科创板日报》1 月 5 日报道,美国研究公司 Gartner 预测,到 2026 年全球 80% 的公司将在其业务中使用生成式 AI,而 2023 年这一比例还不到 5%。
中信证券:2024 年或将成各形态 AI 应用大规模落地元年
据界面新闻 1 月 8 日报道,中信证券近日研报指出,突破传统对话模式,2024 年或将成为各形态 AI 应用大规模落地元年。2024 年,预计国产通用大模型将在多模态、逻辑能力、安全性等方面迎来升级,国产模型能力将对标 GPT4.0 同等或以上能力。基于更强模型,应用端料将突破传统对话模式,全面应用于视觉生成、代码加工、逻辑解析、流程优化等各类场景。看好 AI 应用产品在办公、教育、企业管理、传媒娱乐等领域落地,参考海外 Copilot 等产品形态,以大模型为代表的 AI 各形态应用有望开启大规模落地。