数据猿人工智能2024年度总结:我们经历了波澜壮阔的这一年LOL赛事下注 - 英雄联盟投注 -(中国)Riot Games
日期:2025-01-30 10:07 | 人气:
LOL赛事下注 - 英雄联盟投注 -(中国)Riot Games
诚然,2024年可以说是生成式人工智能大模型领域承前启后之年,虽然未再现GPT-3和ChatGPT横空出世的震撼,但在延续前几年技术积淀的基础上,开启了广泛应用的时代。从AI技术首次涉足诺贝尔奖评选,到Cursor作为AI辅助编程的标杆工具彻底改变开发者的工作方式,再到Perplexity、Talkie等现象级AI应用打入大众市场,以及Sora在多模态生成领域进一步接近自然和人类规律,生成式AI展示了从技术探索迈向实际应用的巨大势能。
与此同时,算力仍然是推动技术进步的关键瓶颈,高昂的研发成本也随之攀升。此外,技术幻觉问题以及隐私与伦理方面的挑战依旧悬而未决。尽管大模型在技术上不断取得进展,吊足了胃口的人类,已不再满足于GPT o1的能力,而是期待通用人工智能(AGI)的世界马上到来。与这一宏大愿景形成对比的是,生成式AI的焦点正在逐步转向小模型的高效化以及低能耗解决方案,以便更加深入广泛的行业应用。另外,日益强化的行业监管和愈加激烈的市场竞争,也为这一领域的发展增添了更多变数与挑战。
去年,OpenAI还有两个里程碑式的大模型发布。一是最早于9月发布的o1模型,代号“草莓”,尽管它的性能要低于后来发布的o3模型,但其里程碑意义不容忽视。o1模型首次实现了在回答用户提问时,形成类似人类思维方式的内部思维链CoT(Chain of Thought),这一突破显著提升了模型在处理复杂和专业性问题时的表现,尤其是在研究、策略制定、编码、数学和科学等领域的高难度任务中,回答的准确性和逻辑性得到了明显改善。“思维链”这一概念也迅速走红,成为2024年大模型领域最常被提及的技术关键词之一。
在运算效率方面,2024年的新一代多模态模型通过引入稀疏激活机制、模型压缩和分布式算力架构,大幅提升了处理速度和响应效率,与以往需要离线计算或长时间生成的模型相比,性能更为出色。此外,这些模型突破了早期多模态技术对单一任务的限制,具备更强的上下文理解能力和任务适配性,能够胜任更复杂的任务,例如根据一张照片生成完整的故事情节,或通过语音输入实现图像增强和视频制作。这些进步让多模态模型在影视及广告行业的应用更为广泛,使其大幅提升内容创作效率、显著降作成本成为可能。
提及算力必须要提到英伟达,去年其H100 GPU凭借卓越的并行计算能力和显著优化的AI训练与推理速度,成为生成式AI的核心处理器。去年3月,英伟达发布了新一代GPU架构——Blackwell,该架构在训练与推理方面展现出卓越性能,进一步巩固了其行业领导地位。同时,谷歌的TPU和亚马逊的Inferentia等专为AI任务设计的定制芯片也在2024年加速普及,这些AI芯片亦推动了算力效率的持续提升,为人工智能的深度应用提供了强大支持。
当用户提出一个问题时,RAG机制让大模型优先从知识库中检索相关文档,这些知识库可能来源于内部文档,也可能是实时搜索获取,然后基于这些可靠数据生成回答,从而显著提升内容的准确性和可解释性,同时有效降低大模型的训练成本。此外,在有些特定领域,如医学、教育,通过微调小模型,可大幅提升其在该领域的表现,不仅应对了大模型泛化能力强但特定领域表现不足的短板,亦使其更容易落地到应用场景,由此开启了大模型企业级应用时代。
实际上,从2024年12月的AI排行榜可以看出,MAU(按月活跃用户)排名靠前的AI应用主要还是集中在办公效率工具领域,除了ChatGPT、Gemini和Claude等聊天机器人外,许多应用在办公场景中亦表现突出。微软Copilot作为早期的样板,推动了办公工具在2024年的全面发展。文章写作、PPT制作、绘图、视频创作、笔记和语法校正等功能,不仅能为用户节省大量时间,还能生成新颖、有创意的成果。不过此类应用的门槛相对较低,同质化竞争较为激烈。同一种需求,市场上可能存在上百个类似产品,脱颖而出并不容易。
成功背后的原因,我们认为主要来自三大方面,第一是AI搜索依靠的技术已经取得了长足进步,正如前面提到的大模型、RAG以及算力,正让搜索结果变得“简单可依赖”;第二,搜索蕴含着巨大的市场,实际是在侵蚀现有搜索引擎的市场空间,AI搜索的前段逻辑是先给出结果,再给出对应的参考网站,这为大量用户节省了二次查找的时间,部分替代了原有搜索引擎的功能;第三,在Agent架构下提供专业领域的知识库,能够灵活地帮助用户查找特定网站或特定专业领域的内容,而传统搜索引擎配置信息源的成本比较高。
具体来说,AppLovin首先采用生成式AI自动生成个性化广告内容,接触到大量的用户,然后通过AI模型实时监测用户获取成本(CAC)和用户生命周期价值(LTV)来动态调整广告预算,形成一个持续优化的闭环,机器学习则帮助平台逐步提升投放效率并降低成本。同时,AppLovin采用多AI Agent协同架构,将复杂的广告运营流程分解为创意生成、行为预测、竞价优化和效果分析等独立的Agent协作运行,如此进一步提升平台的灵活性和效率。
比Applovin更加迅速崛起的2024年现象级应用,Cursor无疑是最值得关注的一匹黑马。这家基于提示词自动生成应用程序的AI应用公司在去年8月份之前还默默无闻,8月a16z和Thrive Capital给Cursor的投资到位,估值4亿美元,到年底的B轮融资,估值高达26亿美元,12个工程师让公司估值上涨了6.5倍,如今已经成为百万程序员的必备神器,靠每月20美元的订阅费,让经常性年收入达到1亿美元。
不只是改变程序员,Cursor重大意义更在于工作方式的变革。在Cursor的世界里流传着一段传奇故事是一位8岁的小女孩利用Cursor在45分钟内就构建了一个聊天机器人,技术对普通人的神奇改变犹如当年的“别针换别墅”;同样不会编程的产品经理陈云飞花了1小时写了一个名为“小猫补光灯”的APP,然后发布在了苹果APP Store,一度在收费榜中排名第一。著名人工智能专家、Coursera创办人吴恩达认为懂AI的产品经理将在未来的市场中占据更为重要的位置,AI让开发门槛降低,而对能够明确“构建什么”的人才需求将大幅上升。
另外值得一提的是2024年获得巨大发展的中国AI出海应用。根据SensorTower发布的2024年上半年美国AI应用市场的下载量数据显示,排名前十的AI应用中有三款来自中国企业。其中,MiniMax的陪伴式应用Talkie在美国下载量排名第四,超越了美国同类产品领头羊Character.ai。MiniMax的另一款AI视频应用海螺(Hailuo)亦曾在9月登顶全球及国内增速榜首,而在教育领域,Question.AI和Gauth更是双双领跑美国市场,成为行业标杆。
作为人工智能与机器人产业交汇处的具身智能(Embodied AI),在2024年悄然取得进步。频繁亮相的特斯拉Optimus机器人去年在运动控制和任务执行方面展现出强大的迭代速度,在运动控制、任务执行、学习能力等方面不断提升水平,业已被特斯拉引入自家的汽车生产线测试。同样,搭载了视觉语言模型(VLM)、能够进行常识性推理,并能与人类进行有效沟通的Figure AI人形机器人Figure 02,也于去年11月正式进入汽车巨头宝马的生产线打工。
2024年,大模型已不再是OpenAI的一枝独秀。如果说2023年以Claude和Llama为代表的挑战者只是星星之火,而在2024年挑战OpenAI的大模型已经燎原。例如,DeepSeek v3模型以仅557万美元的训练成本实现了与Claude 3.5 Sonnet等顶级模型相媲美的性能,显著降低了高性能AI的进入门槛。同时,Meta推出的Llama 3.1和Llama 3.2开源模型在多模态能力上取得重大突破,在图像、音频和文本处理方面更加高效。
受到企业级用户青睐,加上Claude 3.5本身的技术实力,其流量在2024年实现了爆发式增长,从1月的2019万攀升至11月的8932万,增幅高达342%。这一成绩亦与Anthropic的市场策略密切相关,Claude凭借高性能和灵活架构,成为企业整合AI技术的首选方案之一,同时通过相对低价和良好的企业适配性占据市场优势。据报道,2024年美国AI初创企业融资达970亿美元,占全年初创融资总额的近一半,创历史新高,Anthropic抓住这一良机,大幅扩充销售团队规模,从2023年的200余名增长至去年9月的1000余名,同比增长500%,加速向市场渗透。因此,许多中小企业在2024年从开源或其他大模型转移到Claude作为其生成式AI能力的底层支持。
Gemini的信心还源于Google尤其是云服务的强力支持。在电商冲击广告业务、搜索面临Perplexity围追堵截之时,Google比以往任何时候都更加重视AI的推动作用。2024年,Google Cloud以Gemini 2.0为核心,整合旗下AI模型与组件,对Vertex AI平台进行升级,并与其生态系统(如Workspace)实现无缝衔接,旨在吸引更多的企业客户,从需求侧深度绑定谷歌云服务,助力其在云计算和AI应用领域占据更大的市场份额。
我们以字节跳动的AI布局为例。首先,2023年11月,字节成立Flow部门,专注于AI模型的技术开发与应用,共分为三层,Stone团队承担产品研发支持职能;Seed团队主攻大模型研发;Flow团队则聚焦AI产品应用开发。其中,作为底座的豆包大模型以“豆包通用模型PRo”、“视觉理解模型”、“语音合成模型”为主打分别对应文本、视频和音频,其研发水平的提升通过评测的方法不断对比国际同类大模型,而其中又根据不同细分场景,再切出来几十种特定模型,如声音复刻模型、角色扮演模型,适配各类场景应用;而更底层的火山引擎则提供底层算力和云计算基础。
在算力领域,英伟达凭借其领先的技术和生态系统,始终占据行业主导地位。根据Trendforce和Digitimes,单看搭载GPU的AI服务器,英伟达市占率逼近9成,其主要竞争对手AMD市占率则仅约8%。去年10月,AMD发布了MI325系列数据中心加速器,与英伟达依然有显著差距,其管理层表示,与目前正在扩大规模的英伟达Blackwell的竞争可能不那么顺利。从收入的表现来看也是如此,AMD的收入增长并不像英伟达那么明显。