카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

가장 핫한 댓글은?

제어이론과 강화학습에 대한 질문

2023.11.10

9

1829

안녕하세요 요즘 진로 선택에 고민이 많은 학부생입니다.
학부 수업을 듣던 도중 우연한 기회로 강화학습과 제어 이론에 대해 얕게나마 배우게 됐습니다. 수업을 듣는데 정말 신기하고 흥미로웠습니다. 가장 흥미로웠던 부분은 로봇을 제어할때 제어이론을 사용해서 실제로 이런 알고리즘을 따라 동작한다는 것이였습니다.

학부 생활동안 이렇게 저를 설레게 했던 내용은 없던지라 추가적으로 공부를 하거나 관련 랩에서 개별연구를 참여해보려고 합니다.
아직 제가 제어이론과 강화학습에 대해 잘 아는게 아닌지라 실제로 현업에서 활동하시거나 연구를 하시는 분들께 여쭤보고 싶은 것이 있습니다.
1. 이런 제어 이론들과 강화학습의 내용들이 실제 로봇들이 학습되고 동작하는데 사용이 되나요? 주변에서 듣기로는 이런것들은 다 아직은 허상에 불과하고 실제로는 너무 변수가 많아 그렇게 되지 않는다는 얘기를 많이 들어서요. 실제로 사용하는 연구를 학고 싶어서 이 내용이 가장 궁금합니다.
2. 요즘 제어 논문들의 트렌드는 강화학습을 많이 결합시키고 있는 상황인건가요?

감사합니다.

카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

댓글 9개

2023.11.10

우선 저는 로봇관련 분야 학계에서 종사하지만, 강화학습 관련 전문가는 아닌 좆문가 수준이니 다른 전문가분들 말을 더 신뢰하시길 바라며..
1. 로봇팔같이 한쪽끝이 고정된 로봇들은 기구학 해석으로 endeffector의 포지션/힘 등 모든 제어가 이미 수식적으로도 충분히 가능합니다. 자유도가 많아질수록 복잡해질 뿐이지만, 굳이 강화학습이라는 도박을 할 이유가 전혀없는거죠.
2. 반대로 보행로봇처럼 고정점이 정해지지 않거나 계속 바뀌는 시스템은, 수식적으로 해석하기 상당히 어렵습니다. 그래서 보통 2족보행이든 4족보행이든 mass/spring/damping 등의 simplified model로 가정해서 제어를 하는게 일반적이였습니다. 그러다가 최근 강화학습이 생기면서, 프로그램 상에서 강화학습을 돌려놓고, 그 결과로 제어하는 기술들이 많이 나오고 있죠. 국내에서 해당연구를 가장 오랫동안 많이해오신분중 한분이 황보재민 교수겠고요.
따라서 동역학 해석이 가능한 영역에서는 강화학습을 쓸 이유가 전혀없지만, 시스템이 복잡해질수록 강화학습의 매력은 중요해진다 생각합니다.
우리가 실제로 걸을때도 각 관절의 각속도와 근육의 힘 등의 정보를 바탕으로 역학을 계산하면서 걷는게 아니라, 학습을 통해서 걷는거랑 유사하다고 생각합니다.
Underactauted robotics 의 MIT강의도 도움이 되며, 박재흥 교수나 박해원 교수, 황보재민 교수, 김상배 교수 등등 상당히 연구잘하는 분들의 세미나들도 유투브에 찾아보시면 많이 있습니다. 로봇플러스TV, MERRIC, 서울대 세미나 등등 채널 등등 저도 구독해서 많이 봅니다.

대댓글 2개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

IF : 2

2023.11.10

1. 일부 연구용 로봇 외에는 활용되지 않고 있어요.
강화학습이 불확실성 극복하는데는 도움이되지만, 일단 정밀제어에 적용하기에는 힘들고 sim2real 문제로 제대로 학습 시켜보는데 상당히 고생스러워요. 시뮬레이션이야 백날 잘되봤자 실험 해보면 안되는게 대부분이에요...
그래도 기존 알고리즘 기반 방법이 못하는걸 해낼 포텐이 있으니 연구 주제로 삼기에는 매력적입니다.

2. 요즘 트랜드는 강화학습보다 딥러닝 활용하는게 더 맞다고 보이네요.

2023.11.10

누적 신고가 20개 이상인 사용자입니다.

Boston Dynamics 보세요. 다 강화학습임.

대댓글 4개

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

해당 댓글을 보려면 로그인이 필요합니다. 로그인하기

댓글쓰기

게시판 목록으로 돌아가기