카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

가장 핫한 댓글은?

NLP에서 도메인 지식이 얼마나 중요하나요?

부지런한 토마스 홉스*

누적 신고가 20개 이상인 사용자입니다.

2023.03.22

3

797

현재 연구중이시거나 현업에 종사하신 분들께 여쭤봅니다

NLP에서 연구자가 통사론 음운론 등의 언어학적 지식을 알고 있는게 중요한가요?

그리고 추가로 특정한 언어쌍에 대한 Machine Translation 연구를 진행할때 해당 외국어에 대한 언어적 지식이 연구 인사이트에 큰 영향을 미치는지 궁금합니다.

카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

댓글 3개

2023.03.22

전혀요. 그냥 딥러닝이 지가 알아서 배움.

2023.03.22

machine translation을 제대로 하려면 어족이나 linguistic typology에 대한 개념정도는 알아놓으면 나중에 논문쓸때 편합니다.
특히, 논문에서 헛소리하다가 리뷰어한테 깨지는 일은 방지할 수 있습니다.

근데, 요즘은 알면 좋고 몰라도 크게 문제 없어요. 물론 접근 방법론, 대상언어들에 따라 달라지겠지요. 예를 들면, 스페인어, 불어처럼 비슷한 어족에서 파생된 메이저 언어들은 언어쌍 말뭉치도 많고 어휘등이 유사하니 뉴럴넷으로 쉽게 학습할 수 있습니다. 다만, 인도나 아프리카처럼 소수 언어가 많은 국가에서는 아무래도 여전히 언어학 개념이 중요한 테마로 작용하고 있습니다. 아니면, 한자어를 기반 단어들이 많은 한-중-일-월 국가들의 경우 각 국가들의 한자에 대한 데이터 베이스가 있다면, 유용한 소스로 작용할 수도 있겠군요.

연구 인사이트는 어디서든 튀어나오기 마련입니다. 만약 학생분이 언어학에 대한 조예가 깊으시다면, 저같은 컴공쟁이가 손실 함수나 모델 구조 또는 pretraining 방법을 바꾸는 것 보다 더 효율적인 방법을 생각해보실 수 있을것이라고 생각합니다. 당장, CNN이 시각구조, transformer의 self-attention이 고전적인 단어 상관계수에서 영감을 받은 개념임을 고려한다면, 가능성이 없다고는 하지 않겠습니다. 다만, 학생분이 현재 언어학에 대해 잘 모르신다면, 요즘 트렌드를 따라가는 것이 더 안전하면서도 가능성이 높은 길이라고 말씀드리고 싶네요.

대댓글 1개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

댓글쓰기

게시판 목록으로 돌아가기

자유 게시판(아무개랩)에서 핫한 인기글은?

자유 게시판(아무개랩)에서 최근 댓글이 많이 달린 글

🔥 시선집중 핫한 인기글

최근 댓글이 많이 달린 글