편집자 주 - [2024 가을학기 U of T 합격] 김박사넷 유학교육 후기 - 1편에서 이어집니다.
여유가 생긴거죠.
Plan B는 이제 인턴하거나, 인턴도 떨어지면 그냥 하반기 KAIST 지원해가지고 하면 되겠다 정도였어요. KAIST도 제 디펜스 심사해 주셨던 교수님 한 분이 같은 센터이기도 했고 데이터베이스 쪽으로 연구하시는 분이셔서 그분한테 지원할까 하고 있었어요. 만약에 떨어지면요.
그럼 국내 박사하고 포닥을 나가는 쪽으로 생각하신거군요.
그렇죠.
보통은 그렇게들 하는 것 같아요. 국내에서 박사를 하거나, 기업에 들어가거나… (편집자 주 - 구체적인 사례는 공개하지 않습니다.)
갑자기 생각나는데 말씀드려도 되나요? 미국 박사 왜 지원했는지 그러니까 해외 박사를 왜 지원했는지에 대해서 큰 이유 중에 하나가 그것도 있었던 것 같아요. 군대를 갔다 왔으니까 이제 병역에 걸리는 게 없잖아요.
그렇죠.
사실 실력도 뛰어나고 재능도 많은 친구들이 사실 병역에 걸려서 서울대나 KAIST 가는 경우가 되게 많잖아요. 저도 갔다 와 보니까 그냥 기회가 있어서 가는 것도 좋은 것 같다라고 생각이 들어서. 그것도 이제 해외 박사 지원한 이유 중에 하나인 거 같아요.
군대는 병특 안 하고 그냥 다녀오셨죠?
네 그냥 갔다 왔어요. 좀 일찍 갔다 왔어요.
타임라인을 한 번 볼까요. 2022년 2월에 학부졸업을 하실 때 다이렉트 박사를 지원하셨었어요.
네네
그냥 한번 트라이 해본 거예요? 아니면 진짜 나가려고 했던 거예요. 그냥 한두 개 넣어보기도 하거든요.
갈 생각이 있었어가지고 꽤 많이 넣었어요. 그때는 오히려 이번에 지원할 때보다 더 많이 넣었었어요. 왜 그랬냐면 석사를 하면 연구 분야가 좀 포커싱이 되잖아요. 그러다 보니까 오히려 지원할 수 있는 교수님들이 적어져요. 학사 때는 좀 아무것도 모르고 지원했고요.
포텐셜을 고려했던 거죠?
포텐셜도 보고 연구에 대해서 제가 생각할 때 좀 넓은 가능성을 본 거죠. 난 이것도 할 수 있고 이것도 할 수 있겠다. 그러다 보니까 오히려 좀 많은 곳에 지원했던 것 같아요. 그때는 학교 랭킹을 더 많이 봤어요. 이번에 지원하면서 그때를 반추해 보니까 그때 지원한 교수님들은 핏이 좀 안 맞는 데도 있었더라고요.
두 번 지원을 했고 합격도 했는데, 복기를 해보면 뭐가 제일 중요했던 것 같아요?
리서치 핏이 제일 중요했던 것 같아요. 첫번째로 지원할 때 너무 아무 생각 없이 랭킹만 보고 지원했었구나. 아무리 학부생이라고 해도 어떤 연구를 하고 싶은지 스스로 알고 지원을 했어야 되는데 그게 없었다 보니까 그런 결과가 나왔던 것 같아요. 그리고 석사를 했다는 게 지원하면서 좀 플러스 요인이 되는 것 같아요.
맞아요. 보통 석사를 하면 논문도 생기고 내 연구 경험도 생기니까 분야를 좁힐 수 있죠. 아무래도 학부 연구생을 오래한 게 아니라면 예를 들어 6개월 정도 했다면 연구의 맛(?)을 보기가 힘들잖아요.
그렇죠.
이제 질문을 조금 바꿔서 대학원에 가게 된 계기를 여쭤볼까요? 아까 말씀하신 주변 분위기 덕분일까요?
네 그런 것도 있고 저 스스로 흥미가 생겨서 그런 것 같아요.
그럼 전공을 정한 배경은요? ○○님이 입학할 때 컴퓨터공학이 떴었던 시기 같은데요.
네 맞아요. 전공을 정한 데는 일단 여러 가지 요소들이 있었는데 당연히 가족적인 것도 있었고, 사실 그때는 컴공보다 다른 분야도 생각이 되게 많았었어요. 뇌과학이나 그런 쪽이요.
그때 또 뇌과학이 핫했죠.
네 그렇지만 컴공을 지원했던 이유가 컴퓨터를 하게 되면 이제 다른 어떤 걸 하더라도 그 베이스가 될 수 있다. 컴퓨터적인 지식을 기반으로 해서 다른 것들도 좀 쌓아올릴 때 도움이 많이 될 것 같다라고 생각을 해서 지원한 것도 있었어요. 그때는 이제 인공지능이라든가 많이 뜨지 않았을 때였거든요. 그런데 그해 여름쯤에 알파고가 나와서 제가 가고난 뒤부터 이제 붐이 일기 시작했었죠.
재밌는 건 컴공하면 사람들이 거의 소프트웨어 쪽으로 관심을 가지는데 의외로 하드웨어 쪽으로 관심을 가지신 거예요. 완전 하드웨어까지는 아니지만.
네 로우 레벨 시스템 쪽인데, 사실 제가 인공지능 수업을 많이 듣고 특강도 많이 듣고 막 그랬었는데 인공지능은 그렇게 끌리지 않더라고요. 대세긴 한데 끌리지는 않았던? 인공지능 수업도 듣고 수학 수업도 듣고 그랬는데, 사실 처음부터 데이터베이스 쪽으로 갈 생각이 없었거든요. 근데 그게 2학년 때 수업을 듣고 달라진 거예요.
학부 2학년 때.
네 학점을 되게 잘 받아서, 다음 학기에 제가 멘토가 돼서 멘토링 같은 것도 했거든요. 그러면서 수업 들었던 교수님의 데이터베이스 연구실에 들어가서 학부 연구생도 하다 보니까 재미도 느끼고 여기까지 오게 됐네요.
데이터베이스에 관심이 생기고 공부를 조금 더 하고 싶다라는 생각에 대학원을 가게된 거군요. 그러면 유학은 어떻게 결심하게 된 거예요?
사실 어렸을 때 미국 생활은 2년 정도 했어요. 초등학교 때 한 번, 중학교 때 한 번 일년씩이요. 그러다 보니까 해외 생활에 대한 거부감도 상대적으로 좀 덜한 것 같고 괜찮다 나갈 수도 있을 것 같다 생각했던 것 같아요.
주변에서 유학 가보라는 그런 말씀을 들은 적은 있어요?
아버지가 하셨죠. 외국 경험도 있고 군대도 갔다 왔고 나쁘지 않은 학교도 나왔겠다. 그러면 나가는 게 경험적인 측면에서 기회가 되지 않겠냐라고 가장 권유를 많이 하셨어요.
막연하지만 유학 가야겠다 생각했는데 장작을 넣어주신 그런 느낌일까요?
네. 비슷한 얘기를 펜스테이트 인터뷰에서도 말했거든요. 그랬더니 교수님이 자기는 부모님이 반대했다고 그러더라고요. 나가지 말라고 그래서 저랑 다른 케이스구나 생각했었어요.
부모님마다 성향이 다른 것 같아요.
맞아요.
이제 연구분야에 대해 이야기해볼까 하는데, 조금 설명을 해 주실 수 있을까요?
사실 이 데이터베이스라는 게 일상생활에서 많이 드러나지 않는 분야여가지고.
개발자로 치면, 백엔드 개발자가 다루는…
백엔드에서 하는 데이터베이스 같은 거죠. 근데 이제 문제가 뭐냐면 백엔드에서 하는 데이터베이스들은 보통 관계형 데이터베이스를 쓰는데 그게 좀…. 한 문장으로 하면 더 많은 데이터를 더 빠르게 처리하는 게 목표예요. 근데 이제 그러기 위해서는 그 밑에 데이터베이스 시스템의 자료 구조나 데이터를 저장하는 형태나 사용되는 알고리즘이나 그런 것들이 다 달라져야 되거든요. 저는 그 아래쪽들을 연구했었고요.
근데 이제 그게 왜 드러나기 쉽지 않다고 말씀드렸냐면 사실 저희가 카카오톡을 쓴다. 그럼 밑에는 데이터베이스가 다 돌아가잖아요. 근데 그게 사실 내부적으로 10% 빨라졌다 20% 빨라졌다라고 해도 사용자는 못 느낀단 말이에요.
사실 사용자가 알아야 할 필요는 없죠.
네 사람들이 알 필요가 없죠. 데이터가 이제 여기서부터 라우터까지 갔다가 기지국까지 갔다가 상대방한테 가는 것도 다 통신이고 그 안에서 데이터들이 스트림 프로세싱이니 뭐니 하면서 다 처리가 되는데. 그런 것들이 이제 어떻게 처리되는지 뭐가 빨라졌는데 어떤 알고리즘이 쓰이는지 사실 느끼기가 쉽지 않거든요. 그런 내용들을 하는 거다 보니까 말씀드리기가 좀 어려운 거예요.
그럼 데이터 처리 속도는 어떻게 측정하나요?
보통 벤치마킹을 하죠. 실제 생활에서 쓰이는 워크로드 - 여기서 워크로드라고 하는 거는 데이터베이스에 대한 읽기 쓰기 그런 것들이에요. 이제 시뮬레이션을 해서 속도가 얼마나 빨라지는지 그런 것들에 대해서 측정할 때는 벤치마크를 보통 사용하는데요. 시스템 엔지니어 입장에서는 예를 들어 카카오라고 하면 5천만 명이 한꺼번에 사용하는 거에 대해서 그 밑바닥에서 데이터가 왔다 갔다 하는 거를 다루니까 얼마나 빨라졌는지 그런 거에 대해서 신경을 쓸 수 있는데, 사실 엔드 유저 입장에서는 그걸 못 느끼잖아요. 그러다 보니까 이제 좀…
아 카카오 오늘 왜 이렇게 느려 이런 식으로만 받아들인다?
그래서 그런 경우도 이제 많지가 않죠. (그건 그래요.) 카카오 데이터베이스 팀에서 일할 때 들었던 게 새해 인사 아니면 월드컵에서 골 넣는 거 그럴 때 피크를 찍거든요. 그런 특수한 상황 아니면 데이터베이스가 얼마나 빠른지 얼마나 느린지를 사용자 입장에서 체감하기 쉽지 않아요
그러다 보니까 이제 딱 와닿게 말씀드리기는 어려운데요. 우리가 은행이나 그런 데서 사용하는 데이터베이스들은 속도도 당연히 중요하지만 - 이제 좀 하이레벨로 말씀드리자면 – 데이터 정확성이 우선이에요. 안정성 정확성 그런 게 중요한데, 이제 제가 했던 것들은 좀 속도가 우선인 거예요.
속도도 이제 정보를 읽는 속도가 빠르다, 정보를 삽입하는 속도가 빠르다 그 두 가지 정도로 이제 좀 크게 볼 수 있는데 은행 같은 데서 사용하는 그런 관계형 데이터베이스 그런 것들은 이제 육각형으로 치면 좀 모든 면이 좀 고루 있는 육각형 느낌이죠. 제가 했던 거는 좀 읽는 거는 느리더라도 삽입하는 속도를 빠르게 하는 약간 그런 쪽이었고요.
(편집자 주- 데이터베이스에 대해 이야기를 나눴으나 너무 디테일해서 공개하지 않습니다.)
이게 PI 교수님들이랑도 연관된 얘기인데, 이제 데이터베이스 전체 분야다 그러면 이렇게 LSM이 있어요. 저는 LSM을 머신러닝을 통해서 빠르게 하는 거를 석사논문으로 썼고요. 그런데 이건 사실 제가 석사 2년차 때 했던 거고 1년차에는 GPU를 했었죠. 그래서 PI들한테 지원할 때, LSM 다루시는 분들, GPU나 디바이스 다루시는 분들 이런 식으로 지원했던 거죠. SOP에도 그렇게 썼었고요.
사실 ○○님 SOP가 좀 다르게 느껴지긴 했거든요.
어떤 느낌의 에세이였어요? 분류를 하시자면.
이미 합격 자료이기 때문에 코멘트하기가 좀 그런데. (웃음)
하루 걸렸거든요. 이렇게 쓰는 데 진짜 하루 만에 쓰고 리비전 하루 만에 다 하고 그랬어요. 그러니까 이게 시차 있으니까 14시까지 오후 2시까지 제출인데 전날부터 시작해가지고 막 밤새 써가지고.
일단 전체적으로 문장은 좋아요. 근데 구성 같은 것이 좀 많이 달랐다. 보통 (특정 문단) 이게 앞으로 가거나 하죠. 그래야 스토리가 되니까, 하지만 저는 이렇게 꼭지를 잡아서 쓰신 것도 나쁘지 않다고 느꼈어요. LSM 트리라는 키워드로 엮어서 통일성이 있거든요. 다만 큰 그림을 그린다기보다는 해당 연구를 하는 사람들에게 더 와 닿을만한 글이라고 할까요? 논문 초록 느낌.
사실 시그니피컨스 같은 경우는 그 교수님들이 더 잘 알 거라고 생각했었거든요. 사실 SOP 쓸 때 지원하려는 교수님들의 리서치 스테이먼트를 많이 봤어요. 교수님들 약간 그런 게 있잖아요, 좀 이렇게 리서치 관련된 걸 때려박는. 그걸 비슷하게 쓰다보니까 그런 느낌이 든 거 같아요.
그래요. 지도 교수님 이야기를 한 번 해볼까요?
네 지도교수님도 사실은 제가 석사 초반에 논문을 봤을 때 되게 재밌는 연구하시는 분이다하고 생각했던 분이에요. 그 때는 포스닥이셔서 지원은 못했는데 석사하면서 지원할 때 보니까 교수님이 되신거죠. 그리고 이렇게 제 지도교수님까지 되시니까 뭔가 신기하기도 하고, 이런게 인연인가 싶기도 하고요.
어떻게 보면 지금 박사를 가는 게 나은 걸수도 있겠는데요? (웃음)
그러니까요. 그리고 제가 그때 토론토대학교도 운이 많이 작용했다고 말씀드렸던 게 뭐가 있냐면 교수님이 지원자들에게 과제를 주셨거든요.
시기가 언제였어요?
토론토가 12월 1일이 지원서 마감이었고, 12월 22일쯤에 교수님한테 메일이 왔어요. 지원서 봤는데 되게 흥미롭더라. 내가 지원자들에게 한 일주일 정도 할 정도 걸리는 과제를 줘가지고 그 과제를 어떻게 해결하는지를 보고 평가한 다음에 인터뷰를 보려고 한다. 그러셔서 과제를 하게 된 거죠.
어떤 과제였어요?
논문 형태였는데 어떤 느낌이었냐면, 자료 구조 중에 쿠쿠 필터(Cuckoo filter)라고 있어요. 총 7가지 질문이 있었는데, 그냥 필터가 뭐냐, 블룸 필터랑 차이점 같은 거 서술하는 거였고요. 그리고 그걸 자바로 구현한 다음에 - 일종의 코딩테스트랑 비슷한 거죠 - 실험 같은 거 한 뒤에 보고서 첨부하고. 마지막에는 이제 연구 문제, 특정 상황에서 이 자료 구조의 성능을 향상시킬 수 있냐 그런 식의 연구 질문이 있었어요.
말 그대로 ○○님의 역량을 다 테스트한 거네요.
네네 그래서 거의 논문 하나 쓸 정도에 들어가는 품들을 다 체크를 한 것 같았어요. 12월 말쯤에 과제제출을 하고 1월 중순쯤 인터뷰하게 됐고요. 1월 31일날 너를 뽑고싶다, 하면서 합격을 주신거죠. 저는 이게 운이 작용했다고 보는 게 뭐냐면… 이건 기회잖아요.
저의 역량들을 어필할 수 있는 그런 기회인데, 그냥 논문 실적으로만 평가하는 교수님이셨다면 이야기가 달라졌겠죠. 제가 교수님을 비지팅에서 만나서 얘기했던 것 중에 하나인데 이런 역량을 테스트하는 이유는, 논문 실적이 없는 사람도 있다. 그런데 그게 사실 기회가 논문을 쓸 기회가 없어서 증명할 수 없었던 걸 수도 있으니까, 이런 테스트를 통해서 그 사람의 역량을 좀 보고 싶었다 이런 식으로 말씀하시더라고요.
저는 그때 선생님께 말씀드렸던 것처럼 논문 떨어지고 교수님이 국내저널로 처리하라고 하셔서 International 논문도 많이 없고 하니까 좀…. 그거에 대해서 아쉬운 상황이었는데 이제 이런 기회를 주셔 가지고 제 역량을 풀어낼 시간의 기회가 주어지다 보니까 좀 운이 좋았던 것 같아요.
그렇죠. 이런 기회가 있던 것도 되게 운이죠. 교수님마다 채용 기준이 다르니까요. 실제로 이런 역량테스트를 보는 분도 계시고, 실적보다는 인성이나 포텐셜 같은 걸 보시는 분도 계시고.
(편집자 주- 교수님들의 평가 기준 등에 대해 이야기를 나눴습니다.)
맞는 것 같아요. 논문 자체도 막 본인 역량으로 다 해서 한 건 지에 대한 불확실성도 좀 있고요.
그리고 질문 좀 해보면 알잖아요. 논문의 큰 방향성은 학생들이 잘 대답을 못 하거든요. 애초에 너무 좋은 논문을 쓰면 교수들이 썼다고 생각하고요.
저도 펜스테이트 인터뷰 볼 때 논문에 대한 질문을 많이 받았거든요. 이 연구는 왜 했냐, 어떤 내용이었냐 그런 얘기를 하고 나니까 그 말씀하시더라고요. 다른 건 몰라도 교수님이 시켜서 했다 같은 말 안 나와서 좋다고.
맞아요. 박사 과정은 독립된 연구자를 양성하는 과정이니까요. 그러면 스펙 얘기 몇 개만 해보죠. TOEFL이나 GRE는 미리 준수한 성적을 준비하셨네요. 영어는 원래 잘하는 편이셨어요?
네, 아무래도 다이렉트 박사 생각이 있었으니까 미리 만들어 뒀어요. 영어는 아무래도 해외생활도 했었고 해서 좀 편한 거 같고요.
지원하실 때 논문이 2개였고요.
네 다 국내 학회였어요. CV에도 썼는데 밑에 있는 논문이 국내 저널에 내야해서 막 급하게 썼던 거였죠.
그래도 빨리 통과돼서 다행이었죠. 원래는 어디에 목표로 하고 있었어요?
CIKM (Conference on Information and Knowledge Management), EDBT (Extending Database Technology) 같은 데 내려고 했었어요.
근데 다시 생각해도 펜스테이트는 아찔하네요. 처음 딱 뵙자마자 CV 코멘트 듣고 나면요.
코딩 테스트도 중간에 봤는데 제가 되게 천천히 했어요. 제가 긴장하기도했하고 직접 코딩한 지 몇 달 됐어 갖고 버벅버벅거리니까. 아 됐으니까 따로 이메일로 달라고 너무 시간 오래 걸린다고 하시는거예요. 근데 약간 그거는 있었어요. 약간 이렇게 토닥토닥해주는. 어떤 느낌이냐면 그래도 이게 위론지 아닌지는 사람에 따라 다르긴 하겠는데 그래도 코딩 못하는 사람도 있는데 할 줄이라도 아는 게 어디냐 약간 이런 비슷한 거였던 것 같아요. 아까 선생님이 말씀하신 것처럼 그 교수님도 가르치면되는데 약간 이런 마인드(편집자 주 - 공개하지 않은 대화 내용에서 언급했습니다.)가 있으셨던 거 같아요.
또 긴장하고 있는 게 느껴졌겠죠.
그랬었던 것 같아요.
편집자 주 - [2024 가을학기 U of T 합격] 김박사넷 유학교육 후기 - 3편으로 이어집니다.
Copyright 2025. Palusomni all rights reserved.