ideal insane

Resistance ∙ Pioneer ∙ 생산자

Truemin su

AITOP100 본선 후기 겸 일기

Idealinsane 2025. 11. 23. 00:56
728x90

감사하게도 예선을 통과하고, 본선에 오게 되었다. 예선 통과한 것도 참 신기한 일인데 통과하니 또 입상하고 싶은 것은 참 욕심도 많다.
결론적으로 특별상조차 건지지 못했지만, 가방 두둑이 돌아왔다.

본선은 카카오 AI 캠퍼스에서 진행되었다. 셔틀버스도 제공되어 강남에서 타고 갔다.

B1

B3에서 진행되어 공기가 안 좋을 것 같았는데 그렇진 않았다. 일반적인 건물 구조가 아니었다. 층으로는 지하 3층이지만 다 밖이 뚫린 구조이다. if kakao 같은 행사가 진행되는 곳으로 알고 있다. 

신분증 체크 후, 접수하면 목걸이를 받고 정해진 좌석으로 이동한다.
실험복 같은 바람막이를 입는다.
어색한 장소에서 점심을 먹는다.

 

이런 내용을 쓰려던 것이 아니다. 예선, 본선 통 틀어서 내가 느낀 핵심만 짚어보자.
핵심만 짚지만, 생각의 흐름대로 작성한다. 난해하다면 Ai를 쓰십시오 휴먼. :)
(저는 날 것의 생각이 좋더라고요)

"전처리, 데이터 처리의 중요성"

LLM의 입력 값으로 넣기 좋은 형태로 전처리 하는 것이 생각보다 중요했다. 나는 예선 때 문제 웹사이트 스크랩한 것 토대로 문제만 마크다운으로 추출하는 스크립트만 만들어두었다. 내가 예상했던 것보다 문제가 자동화하지 않으면 수동 작업하기에 시간이 부족하도록 양이 많았다. 인수인계 문제는 m4a, docx, txt, jpg 등등 다양한 파일을 처리해야 하는데 이것을 마크다운으로 먼저 처리하고 문제 푸시는 분도 있었다. 다양한 확장자의 파일을 마크다운 형태로 변환하여 문제 풀이할 생각을 못했다. 머리가 띵했다. 대회 준비하면서 n8n으로 파이프라인 만들려고 시도는 해보았지만 노드 데이터 처리가 쉽지 않았다.

"극한의 병렬 처리"

총 9개의 문제가 나왔다. 잘하는 사람들은 9개 문제를 시작부터 모두 병렬로 돌려버린다. 내가 너무 얕봤나? M1 PRO RAM 16GB 기기로는 9개 병렬처리는 과부하가 걸린다. IDE 기반 풀이를 해서 그런지 모르겠다만 나는 램 부족 사태로 버벅거렸다. 나는 문제를 이해하고 싶었다. 풀이 도중에 내가 개입하고 싶었지만 그럴 수 없었다. (맞다 나는 램이 충분한 컴퓨터를 원하고 있다.)

사용한 툴

며칠 전 나온 Gemini 3.0에 좀 감동을 받아서 Google AI Studio와 Antigravity를 활용했다. Antigravity는 한도 제한 때문에 로그아웃하며 구글계정 5개를 꽉꽉 채워 썼다. 그 외 chatGPT Agent mode와 Codex, Cursor를 사용했다. 데이터 처리 같은 경우 Colab도 사용하려고 했는데 왜 인지 zip파일이 해제가 안 돼서 그대로 두었다. 요즘 Colab이 꽤괜이다. (꽤 괜찮다는 뜻) Gemini 가 통합되어서 ML 외의 다용도로 쓰기 좋을 것 같다.

...

내가 중요하게 생각한 것은 검증 가능성이었다. 나는 검증에 초점을 두고 자꾸 이해하고 문제 풀이에 개입하려 했는데 이것이 잘못된 전략이었거나 혹은 이것만이 정답은 아니었던 것 같다. 다른 전략으로는 애초에 자동화 파이프라인의 성공 확률을 높여버리는 것이 핵심인 것 같다. 예선과 다르게 물량에 대응 가능해야 하는 문제들이 나와서 그런 것 같기도.. 하다. 나의 편향적 경험으로 어쩔 수 없었나? (정말 어쩔 수 없었을까?) 본선은 예선보다 빡세다는 다소 당연한 이치를 망각하고 있었다. 결국 본선 문제가 예선보다 대회 취지에 적합했다고 생각한다. 자동화가 된 풀이어야 대회가 의미 있는 것이기 때문이다.

클로드에 특화된 문제가 나온 것 같기도 하고, 클로드 좀 써볼걸 하는 생각이 들기도 하지만~ 그럴 뿐이다.

이미지 생성 관련 문제가 나와서 당황했다. 뭐랄까.. 이 생성을 평가할 수 있는 문제 시스템은 상상도 못 했다. 부랴부랴 나노바나나 api 호출 코드 따서 자동화시키는데 자꾸 이상하게 가고..

예선 때 나왔던 난독화 아스키 아트 코드 사진에서 3번 문항 조각 찾기 문제는 아쉬웠다. 1000개 사진 중에 찾아야 하는데 처음에 어떻게 하지 하다가 전체 사진 특성 생각해서 F 형태의 가운데가 비어 있으니 가로 줄을 갖고 있고, 모양이 평행사변형이니까 이것을 특징으로 찾으면 되겠다 했는데.. 못 찾네.. 자꾸 삼각형 찾아주고.. 이거는 문제를 잘 접근한 것 같은데 프롬프트 문제인가? 적합한 모델을 사용하지 못한 건가. 일단 내가 코드에 손대는 순간 전략적으로 실패하는 느낌이라 이건 아닌 것 같고..
( 다른 분들의 문제 접근 및 풀이 방법이 너무 궁금합니다. 공유해 주세요. )

자동화에 열광하는 사람들이 많이 모인 것 같다. 자동화 with LLM은 무적이긴 하다. 자극도 되고, 욕심도 나고, 문제 풀고 복기해 보면서 현재의 LLM으로 내가 적용할 만한 영역이 생각보다 많을 것 같다는 생각이 든다. 동시에 더 좋은 LLM이 출시되면 내가 만든 파이프라인이 의미 없어질 것 같기도 하다. 머리가 복잡하다. (실제로 예선에서 OCR이 필요한 문제는 예선 당시에 난해했지만, Gemini 3.0 선에서 가볍게 해결되는 수준이었다.) OCR 해결하려고 DeepSeekOCR도 로컬로 돌려봤는데 별 수 없었다.. 네이버 OCR이 잘 된다고 한다. upstage, genspark라는 서비스도 사용하시는 것 같다. 적합한 서비스를 알고 있는 것도 기본적으로 중요해 보인다.

Raw Intelligence(인간 지능)와 데이터에 대한 이해가 가장 중요하지 않았나 싶다. 본선 문제는 컴퓨터 공학과 무관한 참가자는 박멸하는 듯한 난이도와 구성이었다. '과연 컴공 관련 지식이 없어도 풀 수 있나?'를 보고 싶었던 것 같다. 문제 정말 재밌게 잘 출제했다고 생각이 들었고, 완성도 높은 대회 운영이었다.

세상은 모르는 것투성이다.

과연 사람의 검증을 배제한 자동화 파이프라인이 우선되는 것이 장기적으로 맞나? 내가 변화하는 현실을 받아들이지 못하는 것인가? LLM이 현재 검증 가능한 영역만큼 문제를 쪼개고 쪼개고 하면 될 것 같은 걸 보니 이 방향이 맞는 것 같다. 애초에 사람의 검증이라는 게 너무 구식이었던 것 같다.

다양한 생각을 하게 되는 하루이다. 나름의 인사이트를 얻었고, 다른 사람들의 생각이 궁금하다.

언제 이런 고급진 저녁 식사를 하겠느냐만 제 저렴한 입맛을 맞추진 못했습니다.
뽀모도로 타이머 갖고 싶었는데 아주 나이스이다.
C타입 젠더도 기분이 좋다.

반응형

'Truemin su' 카테고리의 다른 글

옛날 사람들이 똑똑했던 이유는  (0) 2023.09.12
변하는 언어와 영원함이란 허상  (0) 2023.09.04
멍청이  (0) 2023.08.05
생각의 기저를 들여다 보기  (0) 2023.07.30
생존  (0) 2023.06.26