AI从业者洞察-第一期

关键洞察

开源模型百花齐放，但Agent方向能力有差距，以GPT4为首的闭源模型在多数评测、榜单中都占据第一。
B端应用场景明确，落地飞快，电商类落地尤快，迅速实现了价值。C端暂时看不到新的应用。

大事儿

新的提示词工程范式思维图（GOT）有望榨干大模型价值，让思维链（COT）从链到树到图。
清华GLM团队发布AgentBench基准，GPT4作为Agent遥遥领先。这个基准评估LLMs作为Agent的能力，用户发现开源模型与商业模型之间还存在显著的能力差距。
**Morph Studio推出了一款名为Morph的AI视频生成工具，希望打造AI抖音生成器。**它能够通过纯文本指令快速生成短视频，其性能和准确率受到高度评价。该公司成立于今年4月，并在5月完成了数百万美元的融资，目前正在Discord上开放免费测试，计划构建面向消费者的视频社区。
**昆仑万维发布国内第一款AI搜索。**无广告、支持多轮追问，搜索结果自动总结成文。
ΩGPT-3.5 Turbo 对企业客户开放微调。早期测试证明，GPT-3.5 Turbo 微调版本的能力在一些小范围任务上可以媲美甚至超越基础 GPT-4 模型。OpenAI 表示，此次微调 API 的传入和传出数据完全归客户所有，它自己或任何其他机构都不能使用这些数据来训练其他模型。这一做法保证了客户数据的安全性和隐私性。（机器之心）
Meta近期开源了名为Code Llama的代码生成模型，开源代码能力可超越GPT4。其在多个数据集上的性能超过GPT-3.5，并在一个实验中被Phind组织用于击败GPT-4，展示了在代码生成和程序开发方面的强大潜力。
Abacus.AI基于llama2-13b 打造32k上下文模型长颈鹿Giraffe。
**波士顿大学「Platypus 2-70B」登顶 Hugging Face 开源大模型排行榜。**该模型基于 Llama2 微调，重点关注在提升性能的同时，使用更少的计算资源和数据。其训练集 Open-Platypus 也通过 Hugging Face 向公众开放。（论文）
阿里将推出大模型数学工具 MindOpt Copilot，用于解决餐饮、零售、物流货运、生产制造等场景的资源配置和优化问题。基于阿里自研大模型、求解器、建模语言开发，借助通义千问大模型，可将用户以自然语言描述的优化问题转化为线性规划和混合整数线性规划的优化模型，并获得最佳答案，如「如何优化餐厅的座位安排」、「如何控制风险并最大化企业收益」或「鸡兔同笼」类问题。（technode）
澜舟科技发布400亿参数孟子GPT发布，性能提升10-15%。其创始人为NLP领域大牛周明。
**阿里巴巴国际站正式对外发布中国外贸行业首个AI产品。**其功能包括标题优化、产品图生成、新品、运营建议等品类策略、智能生成报价内容、提供辅助回复话术等。——该产品与数字外贸全链路紧密结合，包含生意助手和OKKI AI（外贸生意智能工作台）两大服务，为平台乃至全行业商家提供“数字生产力”。
科大讯飞发布电商直播工作台，支持话术撰写、爆款直播间分析学习、智能直播中控、智能复盘等功能。
抖音及火山引擎发起「经典香港电影修复计划」，基于 AIGC 视觉大模型，将在一年内修复 100 部香港经典影片，使其提升到 4K 分辨率。