首个全自动AI科学家诞生AI两周完成人类三年科研
人类科学家三年的工作量,如今AI两周就能轻松搞定!
最近,来自西湖大学的自然语言处理实验室发布了DeepScientist系统,这也是首个具有完整科研能力,且在无人工干预下,展现出目标导向、持续迭代、渐进式超越人类研究者最先进研究成果的AI科学家系统。
在AI文本检测任务中,DeepScientist仅用两周时间就实施和验证了超过1000种不同的假设,在此期间取得了相当于人类三年的进展。
在RAID数据集测试中,DeepScientist设计的方法实现了7.9%的AUROC提升,成功超越了人类现有SOTA方案。
另外DeepScientist还在智能体失败归因、LLM推理加速等任务上也分别达成了新的SOTA。