의식이 흐르는대로 해보는 프로그래밍

  • 홈
  • 태그
  • 방명록
  • About 윤기

Microsoft 1

[Kaggle] AIMO2 : Early Sharing Prize는 이미 나왔지만, (Qwen2.5, TIR, ToRA Paper 리뷰) [2]

목차Qwen2.5-Math-72B-Instruction이번 대세는 Qwen의 Math 모델들이다. 아니 대세 정도가 아니고, 지배하고 있다.가장 처음부터, ~10점 정도의 좋은 성적을 이끌어 나간건 바로 [Qwen2.5-Math-72B-Instruction] 모델을 활용한 방법론이었다. Qwen2.5-Math 모델들에 대한 자세한 내용은 [Qwen 블로그 글]을 확인하자.블로그 글을 가볍게 정리하자면, 다음과 같다.위는 Open-Weight 모델들 중 MATH 데이터셋 벤치마크에 대한 성능이다. 이전에도 Qwen2-Math 모델들이 좋은 성능을 내고 있었지만, 한단계 더 개선되었다. 모델의 개선을 가져온 차이점은 무엇일까? 바로 TIR(Tool-Integrated Reasoning)방법을 적용했기때문이다..

Kaggle 2024.12.16
이전
1
다음
더보기
프로필사진

IT 개발 위주의 블로그입니다. 잡다한 내용이나 고양이, 강아지, 전자기기를 좋아합니다. 주된 관심사는 NLP, ML 전반의 내용

  • 분류 전체보기 (54)
    • 딥러닝(Deep Learning) (10)
      • 논문 리뷰 (4)
      • Etc. (3)
      • Memo. (0)
    • 알고리즘(Algorithm) (29)
    • 코딩 테스트 (1)
    • Kaggle (6)
    • 잡담 (6)
      • 일상 (1)
      • 취업 (4)
      • 체험기 (0)
    • 에러 메모 (2)

Tag

Python, 파이참, anaconda, Inference, server, 재귀, triton, kaggle, TRTIS, DP, tritonclient, 위상 정렬, Tir, qwen, 백준, 캐글, 아나콘다, pycharm, COT, DFS,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright ©One-Way-People All rights reserved.

  • Github

티스토리툴바