论文 5

论文

学术分享:A Practical Probabilistic Benchmark for AI Weather Models

本文探讨了AI天气模型在确定性预报上的优势,并指出现有概率性评估方法因高计算成本难以满足需求。为此,提出了一种无参数、高效的概率性评估方法——滞后集合预报(LE ...
PPT

学术分享:Accurate medium-range global weather forecasting with 3D neural networks

本文介绍了基于人工智能的天气预报系统Pangu Weather,其在再分析数据上的表现优于传统数值天气预报(NWP)方法。Pangu Weather采用3D T ...

贝叶斯
「论文阅读」Model Fusion through Bayesian Optimization in Language Model Fine-Tuning

摘要 针对下游任务对预训练模型进行微调是一种广泛采用的技术,以其在各个领域的适应性和可靠性而闻名。尽管概念简单,但微调需要几个麻烦的工程选择,例如选择超参数和从优化轨迹中确定检查点。为了解决 ...

论文
「论文阅读」DocETL: Agentic Query Rewriting and Evaluation for Complex Document Processing

摘要 分析非结构化数据(如复杂文档)一直是数据处理中的一个持续挑战。大型语言模型(LLMs)在这方面显示出了潜力,最近也有提出基于 LLM 的声明式框架来处理非结构化数据。然而,这些框架主要 ...
论文

「论文阅读」SqueezeBERT: What can computer vision teach NLP about efficient neural networks?

摘要 人类每天阅读和编写数百亿条消息。此外,由于大型数据集的可用性、大型计算系统和更好的神经网络模型,自然语言处理 (NLP) 技术在理解、校对和组织 ...