의식이 흐르는대로 해보는 프로그래밍

  • 홈
  • 태그
  • 방명록
  • About 윤기

qwq 1

[Kaggle] AIMO2 : QwQ-32B-Preview, Early Sharing Prize 얻은 대세의 Long-CoT 모델[4]

목차개요저번에 작성했듯이, 원래 LB 최상위권은 7~10점을 유지하고 있었다. 그 축에는 당연히 `Qwen-72B-Math` 모델이 있었고, 다양한 생성전략으로 LB 상위권을 유지했을 것이라 예측한다.그러던 중 갑자기 QwQ-32B-Preview 라는 모델이 등장했고, 대회에서도 원래 규칙이었던 2024년10월 이전 모델만 사용가능한 내용을 화이트리스트를 통해 허가를 받으면 허용해준다고 변경했다.그리고, 화이트리스트에 올라가자마자 QwQ를 이용한 결과가 나오기 시작했고, Early Sharing Prize도 일부 생성에 필요한 파라미터를 최적화함으로 받을 수 있었다.별개로, 저때 QwQ를 이용한 결과들이 리더보드에 채점됐는데, 당시 한 사람만 20점이 넘는 결과가 나와서 그 사람이 상을 받을 수 있었다...

Kaggle 2025.01.16
이전
1
다음
더보기
프로필사진

IT 개발 위주의 블로그입니다. 잡다한 내용이나 고양이, 강아지, 전자기기를 좋아합니다. 주된 관심사는 NLP, ML 전반의 내용

  • 분류 전체보기 (54)
    • 딥러닝(Deep Learning) (10)
      • 논문 리뷰 (4)
      • Etc. (3)
      • Memo. (0)
    • 알고리즘(Algorithm) (29)
    • 코딩 테스트 (1)
    • Kaggle (6)
    • 잡담 (6)
      • 일상 (1)
      • 취업 (4)
      • 체험기 (0)
    • 에러 메모 (2)

Tag

파이참, anaconda, COT, qwen, 재귀, Python, Tir, kaggle, DP, 아나콘다, 백준, server, tritonclient, pycharm, TRTIS, 위상 정렬, DFS, 캐글, Inference, triton,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright ©One-Way-People All rights reserved.

  • Github

티스토리툴바