行业新闻

在播放新版本的DeepSeek R1之后,外国网民再次居住

作者: bet356亚洲版本体育   点击次数:    发布时间: 2025-06-05 10:32

reddit 社区关于 DeepSeek 更新的帖子|图片来源:reddit  几天前,没有热身或新闻发布会,DeepSeek以低调的方式上传了DeepSeek R1(0528)的更新。最关注的海外是,DeepSeek更新将幻觉率降低了几乎45%-50%,并将R1的性能推向了OpenAI O3和Google Gemini 2.5 Pro的水平。同时,一些海外开发人员和人工智能研究人员已经开始运行基准,并热情地讨论了其在社交媒体平台上的新功能,尤其是与Giant Tech的旗舰模型的差距。从最近几天的海外用户的反应来看,尽管DeepSeek的更新并不像今年年初发布时那样意识到,但它仍然使许多外国网民说“ Goen Mei ying”,并且它也使更多的人向Belis超越了最强大的所有权,这些模型来自中国各种能力的各种AI AI能力? 1 DeepSeek再次在所有类型的AI社区中再次“顶”,Reddit平台具有许多子社区r兴高采烈至AI/LLM。其中,在R/Localllama和R/Sillytavernai等社区中,有许多热门帖子可以更新DeepSeek。 “新的 - 熟练的DeepSeek R1的播放几乎与O3 OpenAI模型相当于Livecodebench!在Open Resource中取得了巨大的成功!”用户的标题已发布了帖子。 Reddit社区有关DeepSeek更新的帖子|图像来源:Reddit一些开发人员测试了最新的R1功能。他们主要在数学和编程问题上赞美R1的性能,尤其是在处理复杂的积分或递归功能时。与以前的版本不同,R1-0528具有“更长期的思维能力”,一些测试人员被教导说它“表达主动性”和“不要迅速放弃”。 “只是尝试了……我有一条高度复杂的代码1200行,并添加了新功能……看来代码质量在O3级别……我可以说哇。”这被称为Reddit社区R/Localllama中的常驻用户。 Reddit社区对DeepSeek U的回应PDATE |图像来源:根据官方的DeepSeek声明进行重新播放:“更新的R1模型在许多基准评估中,在所有国内模型中获得了良好成绩的最高排名O3和O3和O3 Gemini-2.5-Pro。在功能方面,新版本显着改善了模型思维和推理的深度,并支持工具呼叫。其他型号|。S已更新和改进。 R1的主要优点之一是上下文的持久性和耐用性。 AI游戏社区(通常在AI模型测试的边缘,但与对话有关)坚持认为,职责记住过去的微妙细节和响应自主行为。一位用户告诉r/sillytavernai:“一个角色与我争论了一种观点,并提到了过去的三个细节。” “我还没看过。”用户还指出:“ AI通常不主动;我训练了一些AI来主导对话,但这是我第一次看到AI从游戏场景中出来。” Reddit社区中的另一位用户发布了更新的DeepSeek R1 0528在他的所有试验中都获得了全部分数。 “过去的几周令人眼花ni乱 - Openai 4.1,Gemini 2.5,Claude 4-他们都表现良好,但他们都没有在每个审判中获得完整的印记。DeepSeek R1 05 28是第一个这样做的模型,“他说。 Reddit社区帖子有关DeepSeek更新|图像来源:Reddit“这些测试是许多人在YouTube上进行的不现实试验。例如,草莓中的RSS数量或编写蛇游戏等。用户说。我很欣赏(在这里的双关语),但是我有点麻木,很难找到描述它的正确词。这是一个来自一个实验室的免费开放资源模型,该实验室不知道,该模型确实比削减商业模式更好。” X与Reddit社区一样活跃。除了通过基准图表外,有些人还具有Deptseek编程功能。是R1 ... Deptseek R2会非常疯狂。 “ DeepSeek更新帖子X |图片来源:X除了用户的声音和开发人员之后,Deviceek发布了更新后,智能模型的人工评估机构人工评论说,DeepSeek的R1“元和人类”在独立的“智能索引”中说。人造索引人工智能|照片来源:根据特定模型的人工评论,该机构在一份报告中指出:“ DeepSeek R1比Xai的Grok 3 Mini(高)更明智,NVIDIA的Llama Nemotron Ultra,Meta 4 Maverick,Alibaba的QWEN 3 253 253,并且与Google的Google的Gemini 2.5 Pro相当。点),livecodebench(代码生成,+15点),GPQA钻石(推理推理,+10分)和人类的最终考试(推理和知识,+6点)在编程方面,审查机构认为“ R1在索引分析的手动分析中可与o3背后的索引分析中的Gemini 2.5相当”。变化的智能索引主要制造商的RT人工智能模型|图片来源:关于OpenAI比较的人工分析,该机构说:“ DeepSeek仅证明他们可以保持扩大OpenAI RL计算能力的速度。”当然,不可能赞美一切。 In terms of programming capabilities, there are also X users who picky, "If you actually write code with it and Claude 4, you will know that the benchmark description is inaccurate. Posts on X about theDeepSeek updates | Image Source: X Another user overseas in X said, "Deepseek may be a math and logic (standard-of-the-art) sota, but I still use Gemini 2.5 Pro, because it has a huge context." For this issue, DeepSeek在其官方文章中提到,用户需要通过其他第三方平台的R1-0528模型进行128K上下文,但是,一些海外用户认为,如果他们在所有测试中都赢得了第一名,那么R1将拥有相同的低成本,开放的体重和强大的性能 - 许多好处将被“合并”。关于“很少的更新”,DeepSeek今年早些时候推出,它导致了美国股票市场的海啸,Reddit用户开玩笑说:“请首先出售我的AMD和NVIDIA股票。请让我提前三天告诉我。“一些网民开始以另一种方式来赞美DeepSeek的“低调”姿势。一个雷迪特的网民发表了很长的评论,说:“在0528上,他自己的话:他自己的话:低 - keye deptseek的效率包含了一首诗。其他人则仔细地计划了充满期望的大交响曲 - 主题演讲中的豪华演讲,精心设计的演示,DeepSeek的声明给了一个安静的十四行诗。希望你喜欢它。 ”“对Iyong竞争对手的无声打击是最新的。 “下面的另一个网民说。有关DeepSeek更新的Reddit社区帖子|图像来源:Reddit 2“开源的巨大成功”除了其功能之外,还根据国外的互联网反应来判断,这是一个Mong Deptseek的许多好处,开发人员仍然是“开放资源”,或者更确切地说是“开放权重”。由Y组合人组成的在线技术社区Hacker News出现,主要分享基准结果,共享经验以及R1性能改进,尤其是在编码和数学方面的验证。但是与此同时,上面还有很多讨论仍然围绕着人工智能中的“开放资源”展开。许多人赞扬Deviceek在公共公共模型中的重量,但他们还继续指出,外面没有人能够预防或完全验证R1,因为培训数据等尚未发布。此外,尽管它是开放资源并且免费的,但具有6710亿参数的R1本质上是一个巨大的模型,对于普通用户而言,它太大了。虽然今天,R1和Chatgptang比较之间的比赛已成为标准。 Openai A OPENAI可以完全访问普通用户的顶级型号,或者某些定价觉得用户有用,而Deviceek则提供便宜并提供下载的模型权重。 “ DeepSeek是真正的开放AI”在国外用户帖子的标题说。 DeepSeek更新的Reddit社区帖子|图像来源:Reddit当然,并非所有Reddit用户都完全接受。一篇题为“ DeepSeek有多糟糕?”的帖子。已经引起了有关DeepSeek内容内置审查的讨论,并且该模型对“避免”某些问题不满意。这种类型的论点已成为一个常见的“备忘录”,一些用户会否认该模型是重型的,如果开发人员认为这是偏见,他们可以自己修复它。此外,世界上主要模型目前具有内容过滤机制,但特定选择是不同的,西方政治准确性也是如此。在Reddit中,还有一个热门帖子,标题为“开源人工智能获取!”,正如海报所说,Deptseek似乎是成为唯一在模型切割场上真正竞争的公司。其他公司始终可以保留,因为Qwen不愿意开放其最大型号(Qwen-Max)的资源。 “近乎源的人工智能公司总是说,开放的模型资源无法抓住它们。没有DeepSeek,它们可能是对的。但是感谢DeepSeek成为异常现象!”有关DeepSeek更新的Reddit社区帖子|图像来源:在本文下面的评论部分中,有一个尖锐的回应说:“他们这样做是因为最好的情报是驱动革命,而公众将铭记DeepSeek是人工智能的真正先驱,而不是Google,封闭的,封闭的或虚假的人类安全性,在世界上充满广告。” Reddit社区对DeepSeek更新的回应|图像来源:REDDIT用于DeepSeek Update,R/Localllama社区中提到的永久用户:“这使我想起了Onlectai的承诺发布“ O3-Mini级别模型”,但是无法实现它。现在,新的R1超过了许多人的O3米尼(高),并且接近完成O3(高)。 “安全”只是一个道德原因。每当我不得不等到所有营销gi头时,我都可以进行全面审判。毫无疑问,这是一个上升的优势。许多网民已经开始担心自己的命运,例如“ DeepSeek将继续迫使AI公司竞争降价”。一些网民认为,DeepSeek“并不是所有人都在做利他主义。通过发布免费模型您可以避免竞争对手在市场上取得优势。 DeepSeek上的Reddit社区的帖子是tomage的起源:REDDIT值得注意的是,该行业在DeepSeek更新中仍在发布DeepSeek R2。 Xiang回答。