telexed ~ c / bf94c025-ed1radar:40 · otherLIVE
← 피드로
NO.
#bf94c025
분야
기타
출처
GitHub Trending Weekly
게재
2026-05-12 03:10:14
중요도
★ 4/10 — radar 40
`TabPFN`, 표형 데이터용 파운데이션 모델
FIG-0091:1

`TabPFN`, 표형 데이터용 파운데이션 모델

`TabPFN`: fast foundation model for tabular prediction

분류·회귀를 스케일링이나 원-핫 인코딩 없이 바로 돌릴 수 있어, 구조화 데이터 실험 속도가 꽤 빠르다. 대신 GPU 사실상 필수, 적정 범위도 10만 행·2000 피처 이하라 비용 대비 맞는 문제에만 써야 한다.

[ 요점 ]
  1. 설치는 pip install tabpfn 한 줄이고, TabPFNClassifier·TabPFNRegressor로 바로 시작된다. 첫 실행 때 체크포인트를 내려받는다.
  2. 전처리 금지 원칙이 분명하다. 스케일링이나 원-핫 인코딩 없이 넣는 방식이라 기존 피처 파이프라인을 크게 줄일 수 있다.
  3. 실사용 조건은 꽤 빡세다. 8GB VRAM급 GPU를 권장하고 큰 데이터셋은 16GB가 필요하며, CPU는 1000개 이하 샘플 정도만 현실적이다.
  4. 추론은 반드시 배치로 묶어야 한다. 샘플별 predict 호출은 매번 학습셋을 다시 계산해 거의 100배까지 느려질 수 있다.
  5. 적정 데이터 규모도 선명하다. 10만 샘플·2000 피처 이하에서 잘 맞고, 그 이상은 별도 가이드나 TabPFN Client 같은 우회 경로를 봐야 한다.
원문github.com/PriorLabs/TabPFN원문 보기 →

// related