Birdie Blog

Thinking will not overcome fear but action will.

Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization

Arxiv2024.10 经验池

Memory-Enhanced Neural Solvers for Efficient Adaptation in Combinatorial Optimization Arxiv 2024.10.7 InstaDeep 开源:instadeepai/memento: Official Implementation of Memento 摘要 组合优化对许多现实世界的应用至关重要...

Enhancing LLM Safety via Constrained Direct Preference Optimization

ICLR2024 受约束的直接偏好优化

Enhancing LLM Safety via Constrained Direct Preference Optimization 杜兰大学 ICLR 2024 摘要 随着大型语言模型(LLMs)能力的迅速提升,迫切需要将 AI 系统与多样化的人类偏好对齐,以同时增强其有用性和安全性。尽管这些目标往往存在冲突,但实现对齐是至关重要的。为了应对这一挑战,一种有前景的方法是在微调阶段...

A Machine Learning Approach to Solve the E-commerce Box-Sizing Problem

装箱问题 设计最优的包装盒尺寸

A Machine Learning Approach to Solve the E-commerce Box-Sizing Problem 来自:印度 发表:Production and Operations Management 投稿时间:2023.11,接受时间:2024.8 研究背景与问题 如何为电子商务平台上的大量商品(SKU)设计一组最优的包装盒尺寸,以最大化空间利用率...

Learning scenario representation for solving two-stage stochastic integer programs

ICLR2022 二阶段随机优化 学习情景重建

Learning scenario representation for solving two-stage stochastic integer programs ICLR 2022 作者:Yaoxin WU, Wen SONG, Zhiguang CAO, Jie ZHANG 省流 文章提出了一种基于条件变分自编码器(Conditional Variational Autoenc...

Neur2SP Neural Two-Stage Stochastic Programming

NIPS2022 二阶段随机优化 学习价值函数

Neur2SP: Neural Two-Stage Stochastic Programming NIPS2022 多伦多大学 开源: https://github.com/khalil-research/Neur2SP 摘要 随机规划是不确定性决策的一个有效的建模框架。在这项工作中,我们处理两阶段随机规划(2SP),最广泛使用的一类随机规划模型。精确求解2SP需要在计算上难以处理...

Bridging Large Language Models and Optimization - A Unified Framework for Text-attributed Combinatorial Optimization

LLM结合AM

Bridging Large Language Models and Optimization - A Unified Framework for Text-attributed Combinatorial Optimization 荷兰埃因霍温理工大学 2024.12.15 arxiv 以下是省流版 方法 整体结构图如上,说实话不是很看得懂。 作者针对TSP和KP问题进行研...

Learning Randomized Algorithms with Transformers

ICLR2025 随机性 Transformer

Learning Randomized Algorithms with Transformers ICLR 2025 Google,ETH 摘要 随机化是一种强大的工具,它赋予算法非凡的属性。例如,随机算法在对抗设置中表现出色,通常超过具有较大边际的确定性算法的最坏情况性能。此外,他们的成功概率可以通过简单的策略,如重复和多数投票来扩大。在本文中,我们用随机化来增强深度神经网络,特别...

Boosting Neural Combinatorial Optimization for Large-Scale Vehicle Routing Problems

ICLR2025 超大规模VRP

Boosting Neural Combinatorial Optimization for Large-Scale Vehicle Routing Problems ICLR 2025 南方科技大学 王振坤课题组 超大规模TSP(100,000) 开源:https://github.com/CIAM-Group/SIL 摘要 神经组合优化(NCO)方法在求解车辆路径问题(VRP...

GOAL A Generalist Combinatorial Optimization Agent Learner

ICLR2025 多任务

GOAL: A Generalist Combinatorial Optimization Agent Learner ICLR 2025 NAVER LABS Europe 代码: https://github.com/naver/goal-co/ 摘要 最近,基于机器学习的启发式方法在解决各种困难的组合优化问题(COPs)时表现出了令人印象深刻的性能。然而,它们通常依赖于一个单...

A Subpath Ejection Method for the Vehicle Routing Problem

弹射链

A Subpath Ejection Method for the Vehicle Routing Problem 1998 Institute for Operations Research and the Management Sciences 里斯本大学 省流 结合 TSP Ejection Chains,以下是省流版本。 摘要 在 CVRP 下的弹...