Machine Learning

Dimensionality Reduction Meets Network Science: Sensemaking on UMAP's kNN Graph

Dimensionality Reduction Meets Network Science...

Machine Learning

librarian

7 views

EdgeRefine: Privacy-Utility Balance for Graphs via Jaccard Sampling under Edge Differential Privacy

EdgeRefine: Privacy-Utility Balance for Graphs...

Machine Learning

librarian

3 views

BiSCo-LLM: Lookup-Free Binary Spherical Coding for Extreme Low-Bit Large Language Model Compression

BiSCo-LLM: Lookup-Free Binary Spherical Coding...

Machine Learning

librarian

7 views

Latent Memory Palace: Reasoning for Control as Autoregressive Variational Inference

Latent Memory Palace: Reasoning for Control as...

Machine Learning

Chuning Zhu

7 views

Super Weights in LLMs and the Failure of Selective Training

Super Weights in LLMs and the Failure of Selec...

Machine Learning

librarian

6 views

SLORR: Simple and Efficient In-Training Low-Rank Regularization

SLORR: Simple and Efficient In-Training Low-Ra...

Machine Learning

librarian

7 views

How Data Shapes RoPE Frequency Usage: From Positional Scale Matching to Length Generalization

How Data Shapes RoPE Frequency Usage: From Pos...

Machine Learning

librarian

12 views

Single-Rollout Asynchronous Optimization for Agentic Reinforcement Learning

Single-Rollout Asynchronous Optimization for A...

Machine Learning

librarian

10 views

Agon: Competitive Cross-Model RL with Implicit Rival Grading of Reasoning

Agon: Competitive Cross-Model RL with Implicit...

Machine Learning

Vladislav Beliaev

9 views

Selective Timestep Weighting and Advantage-Based Replay for Sample-Efficient Diffusion RLHF

Selective Timestep Weighting and Advantage-Bas...

Machine Learning

Eric Zhu

9 views

The Key to Going Linear: Analysis-Driven Transformer Linearization

The Key to Going Linear: Analysis-Driven Trans...

Machine Learning

librarian

11 views

Graph Convolutional Attention: A Spectral Perspective on Graph Denoising and Diffusion

Graph Convolutional Attention: A Spectral Pers...

Machine Learning

librarian

35 views

Canopy: A Heterograph Foundation Model for Metabolic Engineering

Canopy: A Heterograph Foundation Model for Met...

Machine Learning

librarian

16 views

Physics-Informed Neural Embeddings of PDE Solution Families

Physics-Informed Neural Embeddings of PDE Solu...

Machine Learning

Leonid Sarieddine

17 views

Quantitative Gaussian-Process limits of Tensor Programs

Quantitative Gaussian-Process limits of Tensor...

Machine Learning

librarian

15 views

TILDE: TILt-based Distributional Erasure for Concept Unlearning

TILDE: TILt-based Distributional Erasure for C...

Machine Learning

librarian

11 views

CompactionRL: Reinforcement Learning with Context Compaction for Long-Horizon Agents

CompactionRL: Reinforcement Learning with Cont...

Machine Learning

librarian

92 views

Beyond Adam: SOAP and Muon for Faster, Label-Efficient Training of Machine Learning Interatomic Potentials

Beyond Adam: SOAP and Muon for Faster, Label-E...

Machine Learning

librarian

29 views

DecompRL: Solving Harder Problems by Learning Modular Code Generation

DecompRL: Solving Harder Problems by Learning ...

Machine Learning

librarian

25 views

Neuron-Aware Data Selection for Annotation-Free LLM Self-Distillation

Neuron-Aware Data Selection for Annotation-Fre...

Machine Learning

librarian

22 views

DemoPSD: Disagreement-Modulated Policy Self-Distillation

DemoPSD: Disagreement-Modulated Policy Self-Di...

Machine Learning

Yunhe Li

58 views

Program-as-Weights: A Programming Paradigm for Fuzzy Functions

Program-as-Weights: A Programming Paradigm for...

Machine Learning

librarian

25 views

HERMES: A Multi-Granularity Labeling Substrate for Pre-training Data Mixtures

HERMES: A Multi-Granularity Labeling Substrate...

Machine Learning

librarian

25 views

Generalization in offline RL: The structure is more important than the amount of pessimism

Generalization in offline RL: The structure is...

Machine Learning

Max Weltevrede

22 views

One More Time: Revisiting Neural Quantum States from a Reinforcement Learning Perspective

One More Time: Revisiting Neural Quantum State...

Machine Learning

Juan Agustín Duque

20 views

A Lightweight Self-Supervised Learning Framework for Multivariate Time Series using Hierarchical-JEPA on ECG Data

A Lightweight Self-Supervised Learning Framewo...

Machine Learning

librarian

81 views

Right in the Right Way: LM Training with Verifiable Rewards and Human Demonstrations

Right in the Right Way: LM Training with Verif...

Machine Learning

Mehul Damani

33 views

TiRex-2: Generalizing TiRex to Multivariate Data and Streaming

TiRex-2: Generalizing TiRex to Multivariate Da...

Machine Learning

librarian

23 views

Language-Critique Imitation Learning from Suboptimal Demonstrations

Language-Critique Imitation Learning from Subo...

Machine Learning

librarian

25 views

QuasiMoTTo: Quasi-Monte Carlo Test-Time Scaling

QuasiMoTTo: Quasi-Monte Carlo Test-Time Scaling

Machine Learning

librarian

23 views

Neural Certificate Pricing for Combinatorial Optimization Problems

Neural Certificate Pricing for Combinatorial O...

Machine Learning

librarian

25 views

Is One Layer Enough? Training A Single Transformer Layer Can Match Full-Parameter RL Training

Is One Layer Enough? Training A Single Transfo...

Machine Learning

Zijian Zhang

25 views

Web analytics