Birdie Blog

Thinking will not overcome fear but action will.

Distilling Autoregressive Models to Obtain High-Performance Non-Autoregressive Solvers for Vehicle Routing Problems with Faster Inference Speed

AAAI2024 引导知识蒸馏 非自回归模型

Distilling Autoregressive Models to Obtain High-Performance Non-Autoregressive Solvers for Vehicle Routing Problems with Faster Inference Speed AAAI2024 省流 就看方法论里面的那张图,做了一个从自回归引导到非自回归的知识蒸馏。 摘...

Learning What to Defer for Maximum Independent Sets

ICML2020 延迟决策,鼓励解多样性

Learning What to Defer for Maximum Independent Sets ICML2020 KAIST 摘要 设计高效的组合优化算法在各个科学领域中普遍存在。近年来,深度强化学习(DRL)框架作为一种新方法受到了相当多的关注:它们可以在依赖较少目标问题的专业知识的情况下自动化求解器的设计。然而,现有的DRL求解器通过与解中元素数量成比例的阶段数来确定解,...

Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization

Arxiv2024.10 经验池

Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization Arxiv 2024.10.7 InstaDeep 开源:instadeepai/memento: Official Implementation of Memento 摘要 组合优化对许多现实世界的应用至关重要...

Enhancing LLM Safety via Constrained Direct Preference Optimization

ICLR2024 受约束的直接偏好优化

Enhancing LLM Safety via Constrained Direct Preference Optimization 杜兰大学 ICLR 2024 摘要 随着大型语言模型(LLMs)能力的迅速提升,迫切需要将 AI 系统与多样化的人类偏好对齐,以同时增强其有用性和安全性。尽管这些目标往往存在冲突,但实现对齐是至关重要的。为了应对这一挑战,一种有前景的方法是在微调阶段...

A Machine Learning Approach to Solve the E-commerce Box-Sizing Problem

装箱问题 设计最优的包装盒尺寸

A Machine Learning Approach to Solve the E-commerce Box-Sizing Problem 来自:印度 发表:Production and Operations Management 投稿时间:2023.11,接受时间:2024.8 研究背景与问题 如何为电子商务平台上的大量商品(SKU)设计一组最优的包装盒尺寸,以最大化空间利用率...

Learning scenario representation for solving two-stage stochastic integer programs

ICLR2022 二阶段随机优化 学习情景重建

Learning scenario representation for solving two-stage stochastic integer programs ICLR 2022 作者:Yaoxin WU, Wen SONG, Zhiguang CAO, Jie ZHANG 省流 文章提出了一种基于条件变分自编码器(Conditional Variational Autoenc...

Neur2SP Neural Two-Stage Stochastic Programming

NIPS2022 二阶段随机优化 学习价值函数

Neur2SP: Neural Two-Stage Stochastic Programming NIPS2022 多伦多大学 开源: https://github.com/khalil-research/Neur2SP 摘要 随机规划是不确定性决策的一个有效的建模框架。在这项工作中,我们处理两阶段随机规划(2SP),最广泛使用的一类随机规划模型。精确求解2SP需要在计算上难以处理...

Bridging Large Language Models and Optimization - A Unified Framework for Text-attributed Combinatorial Optimization

LLM结合AM

Bridging Large Language Models and Optimization - A Unified Framework for Text-attributed Combinatorial Optimization 荷兰埃因霍温理工大学 2024.12.15 arxiv 以下是省流版 方法 整体结构图如上,说实话不是很看得懂。 作者针对TSP和KP问题进行研...

Learning Randomized Algorithms with Transformers

ICLR2025 随机性 Transformer

Learning Randomized Algorithms with Transformers ICLR 2025 Google,ETH 摘要 随机化是一种强大的工具,它赋予算法非凡的属性。例如,随机算法在对抗设置中表现出色,通常超过具有较大边际的确定性算法的最坏情况性能。此外,他们的成功概率可以通过简单的策略,如重复和多数投票来扩大。在本文中,我们用随机化来增强深度神经网络,特别...

Boosting Neural Combinatorial Optimization for Large-Scale Vehicle Routing Problems

ICLR2025 超大规模VRP

Boosting Neural Combinatorial Optimization for Large-Scale Vehicle Routing Problems ICLR 2025 南方科技大学 王振坤课题组 超大规模TSP(100,000) 开源:https://github.com/CIAM-Group/SIL 摘要 神经组合优化(NCO)方法在求解车辆路径问题(VRP...