ML 탑티어란 ICML 하고 NeurIPS 라고 칠게. (ICLR, AISTATS 등도 수준 높지만 일단).
일단 옛날에 NeurIPS가 NIPS라고 불리던 시절엔 그 명성에 맞는 운영과 리뷰 퀄리티가 나왔음. 리뷰도 5~6명씩 붙었던 경우도 많았고. ICML도 마찬가지임.
--------------------
1. 결론: 즉 리뷰 퀄리티와 학회 운영은 과거가 훨씬 나았음.
그럼 논문 퀄리티를 보자. 일단, ML자체가 지금 매우 좋은 모습을 보여주고 있잖아? 공학적인 관점에서 지금과 과거의 차이는 엄청나게 크지. 공학의 관점에서 과거는 현재를 이길수가 없지 (학문이 발전하니까). 또한 상위권 논문에 경우 과거에는 꿈만팔고 있었다면 이제는 진짜 꿈이 실현되는 느낌임.
다만, 논문으로서 '말이되는지' (correctness) 여부는 현재가 더 노이지함. 이상한 논문도 가끔 붙음. 이건 기존 수학, 통계위주 머신러닝흐름하고 현재 뉴럴넷 기반 딥러닝 하고의 차이라고도 보여짐.
------------------
2. 결론: Significancy 는 현재가 우위, Reliability는 과거가 우위.
마지막으로 논문을 내는 난이도와 경쟁에 대해서 논해 보려고 해.
일단, 과거는 1번에서 언급했듯이 상대적으로 리뷰 퀄리티가 클린했음. 즉 좋은 논문은 붙고, 안좋은 논문은 떨어졌겠지. 지금은 scalability 이슈로 인해 불확실성이 너무 커졌음. 대가들도 무참히 떨어지는 경우 엄청많음.
물론 떨어져야할 논문이 붙는 운좋은 경우도 과거보다 많아졌음. 하지만 NeurIPS의 통계실험 (유명하지, 2개의 독립적인 리뷰를 받게하고 consistancy를 재는 실험) 에 의하면, 붙어야 될 논문이 떨어지는 noise가 더 크리티컬 했다는거야. 그 이후로 AC들이 나서서 구제도하고 판단도하면서 accept rate도 올라갔음.
경쟁에 대해서는 말이안되는 수준이지. 애초에 CS자체가 지금은 인재들이 몰리지. 나는 K 다니는 사람인데 애초에 과 인기가 말이안됨. 과거엔 CS 대학원 커트라인은 그냥 없는 수준이였음. 지금은 AI대학원 누구나 가고싶어하고 인기랩은 인턴 2년하는 애도있음. 수학, 물리, 전산 3복전하고 AI하는 애도 꽤많음. 인재 유입이 어마어마하게 되고있음.
따라서, 논문내는 난이도는 난 오히려 올라갔다고 생각함 (노이즈 등 억까 이슈 + SOTA뺏기는 경쟁적 흐름). 다만 이상황에서 논문 5~6편 들고 있는 괴수들이 많아지는건 그만큼 똑똑한애들이 많이 유입되고, 교수들도 잘하는 사람이 많아져서 선순환이 이루어졌다고 봄.
--------------
3. 결론: 학회 합격 난이도는 현재가 과거보다 높다고 보여짐.
그냥 요즘 AI하는 사람들 고생 많이함. 노력도 많이하는데, 논문 1개 가치도 후려치기 하는 사람도 많아지는 추세임. 더구나 기업들의 무자비한 폭격으로 학교에서 할 수 있는 것들이 점점 사라지고있음. AI는 너무 실전임.
Yoshua Bengio도 블로그에 요새 (AI) 대학원생들아 과거보다 훨씬 고생한다고 언급하기도 했지.
눈팅하다가 분야 논문 개수 후려치기하는 친구들 많이 보여서 글남긴다.
카카오 계정과 연동하여 게시글에 달린 댓글 알람, 소식등을 빠르게 받아보세요
댓글 19개
칠칠맞은 헤르만 헤세*
2023.04.08
대체 뭘본거임?
청승맞은 아인슈타인*
2023.04.08
난이도를 떠나서 글 말미에 논문 개수 후려치지 말라니까 하는 소린데, 그렇다고 논문 갯수 중시하는 문화도 연구 후진국스럽고 참 없어보임. 한 편이라도 임팩트있는 논문을 쓰려고 하는게 아니라 어떻게 하면 1년에 몇편 썼다고 자랑할까를 궁리하는 듯 함. 것도 포스터만 잔뜩 쓰는 수준이
대댓글 3개
2023.04.08
일단 임팩트 따져야하는 건 동의함.
다만 oral이 poster 보다 꼭 임팩트 있는 것은 아님. Oral써본 사람은 (nips 오랄 써본사람 손이 꼽음) 그거 크게 의미있다고 가치 많이 안둠. 포스터라고 무시할 수는 없음 (생각보다 쓰기 어려움 진짜로).
그리고 1년에 편수 자랑하는건 우리나라만 그런건아님. 미국 탑티어 랩이나 회사도 그럼. 대학원생 입장에서 편수 많이 쓰기, 이정도 목표 삼는게 큰 문제는 아니라고 생각함.
청승맞은 아인슈타인*
2023.04.08
너무 포스터를 옹호하고 싶은 나머지 사실과 다른 내용들을 살짝살짝 덧붙이는 느낌인데, cv의 경우 오럴과 포스터 억셉률은 탑티어의 경우 6배정도 차이나고 오럴에 의미를 안두는 랩은 없음. 각 랩 publication 에 보면 oral은 눈에 띄게 따로 표시함. 우리 지도 교수도 가능하면 오럴 수준의 논문을 쓰기를 권장하고 있고 (미국). 그리고 논문 편수를 강조하는건 한국이 유독 심한거 사실임. 뭐 질을 추구하기 힘들면 양이라도 추구하는게 맞기는 하지만 너무 양을 강조하면 스스로 2류라고 인정하는 꼴이랄까...
2023.04.08
비전쪽은 모름. 내가 ML쪽이라고 했잖아.
2023.04.08
후려치기는 아닌데 개인적으로는 수요와 공급 때문이라고 생각함. ai 분야가 일반적인 분야 (소재 제외) 보다 논문 내는 편수가 많아서 그런거라 생각됨. 난이도가 문제는 아니라고 생각되는게 평가 하는 사람이나 주위 학자들은 관심 없음. 평균 탑 컨퍼 3편 쓴다고 하면 그게 대학원생 평균으로 보는거 같음. 근데 그게 실제로 맞을수도 있음. 갠적으오 임용이나 채용 목적으로는 ai 컨퍼 몇개 보다는 다른 분야 탑저널이 경쟁력 있다고 생각함.
대댓글 2개
2023.04.08
ai 탑컨퍼 쓰는 사람은 너무 많아서 그럼 외국 유명 랩들은 쏟아냄 저게 가능한가라는 생각이 들 정도로 많이냄. 반대로 네이처 네컴 탑저널은 외국 유명 랩도 쏟아 내지는 못함. ai는 탑컨퍼가 많고 순위화가 덜되어 있어서 양으로 말하는거 같고 다른 쪽은 저널 명성으로 말하는거 같음
2023.04.08
일단 다른분야 탑저널 vs AI 탑컨퍼를 direct하게 비교하기는 어려움. 아무래도 AI탑컨퍼를 양산하는 사람 수 > 타분야 탑저널을 양산하는 사람 수는 사실임. 희소성의 관점에서 이 말이 맞을 수 있음.
다만 수요 공급법칙에 의해서 탑티어 많이쓴 AI 박사는 공급도 상대적으로 많아졌지만 그 수요가 아직 더 많음. 연봉도 높고 취직하기에 좋음.
임용도 딱히 불리한지 모르겠음. 심지어 탑티어 많이 안써도 좋은학교 임용되더라고 (놀라울정도로). AI대학원, 전산, 전전, 산공, 응용통계 이런 분야에서 딥러닝 박사들도 임용 많이하더라고. 아무래도 트렌드나 인기가 반영된게 아닌가 싶음.
소심한 소크라테스*
2023.04.08
논문 문화도 머신러닝스럽다 생각함
가비지 잔뜩 생산하게 되는 거 감안하고 샘플 수 잔뜩 늘리고 그 중에서 진주 찾기하는 중
진주는 분명히 있음 대부분 쓰레기라 그렇지
대댓글 3개
2023.04.08
일단 머신러닝 스럽다는 말에서 분야에 대한 어느정도 비하가 있다고 느껴지지만, 진주를 찾아내는 프로세스는 이게 맞는듯
소심한 소크라테스*
2023.04.08
ㄴㄴ 그냥 구글 알파코드 생각나서 말한거 비하 의도는 없고
2023.04.08
ㅇㅇㅇ 맞지. 샘플수늘리고 진주찾고, 다시거기서 샘플수 늘리고 무한반복
소심한 소크라테스*
2023.04.08
근데, 전분야 통틀어 석사과정 및 박사과정 초년차가 대거 심사에 참여하는 탑수준 학회 및 논문지는 없다고 봄.
또, 커뮤니티 당사자들도 인정할 수 밖에 없을 정도로 리뷰 시스템이 망가졌고, 리뷰가 논문 합불을 가리는 상태에서 망가진 시스템에서 나온 논문을 과연 탑이라고 하는게 맞나?에 대한 의구심은 무조건 해봐야하는 상황
고생하는 건 속도전으로 논문 찍어내는 분야는 대부분 그럼 이전엔 현재만큼의 속도전은 아니었으니까 고생이야 지금 더 하겠지. 근데 속도 때문에 고생하는거랑 붙는 난이도랑 무슨 상관인지 모르겠음
솔직히 요새 논문 질보다, 포맷팅 잘 해서 제출하고 기도메타 들어가는게 더 낫다는 얘기까지 하는 판국인데 인정할 건 인정해야지
대댓글 3개
2023.04.08
난이도는 높은게 맞지. 속도에 맞춰서 결과를 내야하는데, 한번 떨어지면 SOTA 따이는 분야가 어딧냐.
리뷰 퀄리티가 개판낫는데 그게 통계적인 분석을 해보면 아랫쪽으로 bias가 걸린다니까? 무식한놈들이 리뷰하면 남의 깎아내리기 급급하다 이말이야. 세계적인 대가랩에서도 많이 떨어짐. 그렇게 억까당하고 떨어지고나면 유행바껴있는데, 이게 논문내기 '쉬운'게 맞나?
소심한 소크라테스*
2023.04.08
bias가 아랫쪽에 걸린다는 건 최소 포스터에 대해 의구심을 가져야하는게 맞다는거지?
2023.04.08
아 그말이아니고,
좋은 논문이 억까당하는 비율이
안좋은 논문이 올려치기 당하는 비율보다 높다는거임.
너그러운 아담 스미스*
2023.04.08
속도전이 붙었다는 사실 자체가 분야 난이도가 올라갔다는 사실을 반증하죠. 지금 ai분야가 너무 핫해서 전세계에 똑똑한 인재들이 모두 이 분야에 몰려들어서 논문 미친듯이 찍어내는 추세라 인재경쟁, 물량경쟁, 속도경쟁의 강도가 매년 심화되고 있습니다. 이것 자체가 학회난이도가 과거와 비교해서 말도 안되게 올라갔다는 것을 의미하죠.
또한, 불과 10년전만해도 억셉되지 않았을 법한 퀄리티의 논문들이 탑티어 학회임에도 심심찮게 보인다는 논조에는 동의하나, 그것이 과거와 비교했을때 현재 학회수준이 떨어졌다는 뜻은 아닌것 같습니다. 과거와 비교했을때 학문적으로나 실용적으로나 더 큰 영향력/파급력을 가지는 논문들은 현재에 더 많이 생산되고 있습니다 (이는 앞서 언급한 업계경쟁심화에 의한 당연한 결과이죠). 즉, 현재 학회에서 발표되는 논문퀄리티의 상한값은 현재가 과거와 비교할 수 없게 높다고 봅니다. 다만, 학회의 퀄리티 콘트롤이 과거보다 재기능을 못하고 있는것이 분명해보이고 따라서 퀄리티 상한과 하한의 간격이 매우 벌어진 것 같습니다.
2023.04.08
2023.04.08
대댓글 3개
2023.04.08
2023.04.08
2023.04.08
2023.04.08
대댓글 2개
2023.04.08
2023.04.08
2023.04.08
대댓글 3개
2023.04.08
2023.04.08
2023.04.08
2023.04.08
대댓글 3개
2023.04.08
2023.04.08
2023.04.08
2023.04.08
대댓글 1개
2024.10.28
2023.04.08