Record: Fused Triton MLP + Full GPTQ + Coprime Loader + XSA-all + BH2816 (val_bpb 1.1116) by barneywohl · Pull Request #1135 · openai/parameter-golf

barneywohl · 2026-03-30T15:31:54Z

Record Submission

Author: @barneywohl
Date: 2026-03-30
val_bpb: 1.1116 ± 0.0005 (3-seed mean)

Results (8×H100 SXM)

Seed	Sliding BPB	Artifact
1337	1.1110	15,982,859
42	1.1121	15,981,083
2024	1.1118	15,982,475
Mean ± Std	1.1116 ± 0.0005

Improvement over SOTA

vs merged SOTA (1.1194): -0.0078 nats (requirement: ≥0.005) ✅
vs PR Record: 1.1122 BPB — Coprime-Stride Loader + Full GPTQ + XSA-all (3-seed mean) #1060 (1.1122): -0.0006 nats

Stack

Fused Triton MLP — custom kernel for leaky_relu(x,0.5).square(), saves 1.8ms/step
Full Hessian GPTQ — Cholesky + actorder + 5-way clip sweep
Coprime-stride loader — multi-shard diversity with memmap
XSA on all 11 layers — exclusive self-attention everywhere
BigramHash(2816×112) — enlarged bigram features
fullgraph=True torch.compile

Built on PR #549 by @abaybektursun with techniques from PRs #726, #634, #1019, #287.

See records folder for full README, logs, and reproducible script.

…816 (val_bpb 1.1116) 3-seed mean: 1.1116 ± 0.0005 Seeds: 1337=1.1110, 42=1.1121, 2024=1.1118 Stack: LeakyReLU² fused Triton kernel + Full Hessian GPTQ (actorder+Cholesky) + coprime-stride multi-shard loader + XSA on all 11 layers + BigramHash(2816x112) + fullgraph=True torch.compile Built on PR openai#549 scaffold with techniques from PRs openai#726, openai#634, openai#1019, openai#287.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Record: Fused Triton MLP + Full GPTQ + Coprime Loader + XSA-all + BH2816 (val_bpb 1.1116)#1135

Record: Fused Triton MLP + Full GPTQ + Coprime Loader + XSA-all + BH2816 (val_bpb 1.1116)#1135
barneywohl wants to merge 1 commit intoopenai:mainfrom
barneywohl:submission-fused-gptq-coprime

barneywohl commented Mar 30, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

barneywohl commented Mar 30, 2026

Record Submission

Results (8×H100 SXM)

Improvement over SOTA

Stack

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant