公司年终工作总结


【新智元导览】随着AI技术的持续进步,2024年成为人工智能领域发展的里程碑式年份。在这年终之际,我们回溯梳理了这一年的重大事件和成果。

年终岁末,AI领域的蓬展引发了关注。在年末之际,专业机构Artificial Analysis为我们带来了对今年AI领域变革的深度回顾。值得一提的是,Qwen2.5 Instruct 72B、DeepSeek V2.5以及可灵AI等我国的技术成果也赫然在列。

毫无疑问,2024年是AI发展史上具有划时代意义的一年。这一年里,我们见证了AI技术在短短时间内对我们的生活、学习方式产生的巨大影响,各种AI技术的革新也令人目不暇接。

大模型的能力提升成为了今年AI领域的亮点。从GPT-4o的交互式问题解决,到o1的惊人推理能力,再到最新发布的o3,OpenAI始终引领着AI技术的前沿。而Claude 3.5 Sonnet出色的辅助代码体验也为Anthropic带来了与OpenAI的激烈市场竞争。

就在今年12月,Google也以Genmini 2.0 Flash和Genmini 2.0 Flash Thinking的发布成功实现了逆袭,为AI领域带来了新的活力。

左栏右侧排布展现内容

自从OpenAI在2022年底推出了ChatGPT这一基于GPT-3.5模型的生成式AI以来,一场轰轰烈烈的「军备竞赛」在AI领域全面展开。

随着时间的推移,仅用了不到两年的时间,许多实验室就相继超越了OpenAI的GPT-4,如今已有一批智能水平超过GPT-4o的模型出现,如Claude 3.5 Sonnet、Gemini 1.5 Pro和最近发布的Gemini 2.0 Flash等。

据统计,LLM领域目前仍是主导,包括ChatGPT、Gemini、Claude、Nova、LLama系列等大模型均位于前沿。我国虽稍显落后,但Qwen2.5 Instruct 72B和DeepSeek V2.5等成果也在国际上得到了广泛关注。在全球范围内,除、外,法国、加拿大和以色列的个别实验室也在该领域达到了一定水平。

虽然开源模型在性能上逐渐缩小与专有模型的差距,但价格方面的差距也明显下降。这也意味着对于消费者来说,可以更便宜地获取到高水平的AI服务。

更为值得欣喜的是,语言模型的推理定价得到了显著降低。例如GPT-4o Mini模型虽然在智能水平上与GPT-4接近,但价格却下降了整整100倍。同样地,国产大模型Qwen2.5 72B的得分超过了GPT-4 Turbo的价格仅是后者价格的1.3%。

大模型的小型化发展迅猛。更大的上下文窗口允许模型包含更多的多模态输入如图像、视频和音频等信息。现如今其上下文窗口长度已经扩展到128K tokens的长度,与去年三季度相比增长了高达32倍。

对于用户而言,选择头部企业的产品如OpenAI、Meta、Anthropic、Mistral和Google等是当前的趋势。而推理质量、上下文窗口大小、价格和速度则是决定用户选择的重要因素。

不仅仅是对于特定的应用场景需求而言如此丰富与深入的人工智能处理能力也在促进模型应用于更多的需求中。无论是对文本信息进行抽取还是生成复杂长文等应用需求已不再局限且也备受瞩目与青睐于多模态能力更强的模型。

开发者们对于使用多个模型也成为了常态。他们通常采用已发布的成品模型进行直接使用或对现有模型进行微调以适应特定需求。尽管从头开始训练新模型的情况相对较少但也依然存在。

图像生成质量的飞速进步也不容忽视。其中特别值得注意的是图像的真实感表现和提示匹配以及文字渲染等进步明显如在生成中「Artificial Analysis」旗下的未来宇宙飞船环绕在壮丽地球之上的效果已经十分逼真且符合实际规律。