这是你没有体验过的船新版本
自从DeepSeek全球爆火后,AI领域仿佛被按下了加速键,各大公司纷纷推出自己的AI产品。
这一周,不少新的AI模型涌现出来,如马斯克的Grok 3、Anthropic的Claude 3.7 Sonnet、阿里的通义QwQ-Max-Preview、腾讯的Turbo S等等。还有DeepSeek开源周的活动,真是让人目不暇接。
昨晚,备受期待的OpenAI终于推出了GPT系列的全新版本——GPT-4.5。奥特曼表示,这次的GPT-4.5是一种全新的智能体验,其中蕴许多前所未有的奇妙之处,它将是第一个让人感觉像是在与一个有思想的人交流的模型。
我对此并没有过高的期望。自从两个月前连续十几天关注他们的无聊发布会后,我对奥特曼的信任度有所降低。对于GPT-4.5的发布,我并没有抱太大希望。发布会上奥特曼也并未现身,据说是回家带孩子去了。
在使用GPT-4.5后,我认为它算是“中规中矩”的亮相。与其他网友的反馈相似,外网上关于GPT-4.5是否垃圾的讨论也在持续进行,许多人并不看好它。
从性能上来看,GPT-4.5在OpenAI官方给出的基准测试中表现并不出色。在科学、数学、编码能力上,它甚至不如去年发布的o3-mini。在困难的学术基准测试如AIME和GPQA上,它的表现也显得不够强大。
从网友的实测数据来看,GPT-4.5与同期发布的Claude 3.7相比也存在不小的差距。例如,在思维理解和导图生成方面,Claude的表现已经可以达到PPT插图级别,而GPT-4.5的绘图能力就像小学生作业一样简单。更糟糕的是,GPT-4.5的运行速度还很慢。
而在价格方面,GPT-4.5的表现更是令人难以接受。其每百万Tokens的价格高达75美元,相比之前的版本增长了30倍。与DeepSeek相比,差距更是高达280倍。考虑到DeepSeek的折扣,差距甚至超过1000倍!这样的价格让人难以接受。
尽管OpenAI官方强调GPT-4.5的语言能力是其独特之处,并声称它可以在对话中分析人类情感需求、提供情绪价值等,但这似乎并不能掩盖其在性能和价格上的不足。网友们对此也持怀疑态度,认为这只是情商的体现而非真正的实力提升。有些人甚至将其比作字节的豆包聊天机器人等。在与DeepSeek等其他模型相比较时,OpenAI无疑面临挑战。尽管GPT-4.5在某些方面可能存在创新之处(如情商),但在推理和应用方面表现平平甚至欠缺的表现也引起了质疑。一位前OpenAI员工甚至表示虽然对GPT-4.5在情商方面的表现感到满意认为这是进步之一但它的表现远非传统的推理模型在更高层面上预测发展方向等更重要的能力上也有待提高在后续开发中预计会出现更加面向推理的新型模型并逐步转向新的发展方向另一方面此次GPT-4.5的发布在某种程度上也标志着传统依赖大规模算力竞赛的时代正在逐渐放缓而开源模型阵营已经开始探索更高效的方法在这个过程中像DeepSeek这样的开源模型不仅能够给大众提供免费的技术和资源也使得人工智能开发者能够在更低成本下更快速地实现技术的迭代与革新从这个角度看未来的AI训练可能不再是传统的算力竞赛而更侧重于更高效的技术路线此次DeepSeek的开源数据已经引发了广泛的关注甚至引起了GitHub社区的重视开发者们对其充满了期待这意味着新的技术和新的生态正在兴起在这样的背景下我们可以预见未来的AI行业将会呈现出更为多样化和高效的竞争局面不断向前发展开启新的篇章总之一切看起来如此富有潜力在这个崭新的领域中我们能预见的是更多的创新和突破让我们共同期待这个行业的未来发展吧尽管如今行业前景充满希望但也存在着许多挑战未来道路充满未知需要所有参与者共同努力共同推动行业的繁荣发展总的来说人工智能领域正在经历前所未有的变革和机遇让我们共同期待其未来的发展吧!