카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

가장 핫한 댓글은?

심리학계 재현위기의 근황, 시사점 및 대응방법 (심리학계 재현위기 3편)

IF : 1

2023.03.26

22

14943

1편: https://phdkim.net/board/free/40393
2편: https://phdkim.net/board/free/40412

이 일련의 과정을 crisis 로 볼것인가, 심리학의 renaissance 로 볼것인가.

학자들끼리의 이성적 토론을 넘어, 감정적으로 충돌하고, 서로의 연구를 폭로하였으며 수십개의 발표된 논문이 철회되기도 했음. 몇몇 학자들은 그결과로 신임을 잃어서 커리어에 큰 타격을 입었고, (그들중엔, 동료의 데이터를 믿고 co-author 으로서 참여했다가 피해를 본 학자들도 적지않음) 테뉴어 심사에서 탈락하거나 심하게는 직장을 잃음.

하지만 이러한 과정으로 새로운 관행이 만들어졌고, 처음 이 crisis 의 스타트를 끊은 트리오는 2018년 출판된 "Psychology’s Renaissance" 라는 논문을 통해 다음과 같은 말을 남김: "만약 심리학자들이 7년동안 동면에 빠졌다가 오늘날 일어났다면, 본인들의 분야를 알아보지 조차 못했을 것이다". 그만큼 그사이 학계에는 혁명적 변화가 있었음.

가끔은 너무 잔인하게 흘러간 면이 있지만, 이 새로운 관행은 결국 주류가 되기 시작함. 그리고 1,2편에서는 심리학분야를 중점으로 다뤘지만, open science 는 모든 과학의 대체적 흐름이기도 했음.
대학에서도 open science 에 대해 모르는 젊은 학자들은 교수로 채용을 안하기 시작하는가 하면, 미국의 일부 명문대 는 기존의 publish or perish 정신의 H-index 가 아닌, R-index (reproducibility index) 를 포함한 open science 의 새로운 기준에 부합하지 않으면 테뉴어를 안주기 시작함 (대표적으로 John Ioannidis 교수의 영향을 받은 스탠퍼드대학교. 그는, 여러과를 돌아다니며, 동료학자들을 설득, 스탠퍼드대학 전체에 이러한 문화를 뿌리내리는데 기여함). 또한 메이저 연구 제단들도 프로젝트에 open science 에 관한 내용을 proposal 에 포함시키게 하는 조항을 추가하기도함.

이렇게 주류의 판이 점점 바뀌고 있는데, 아직 이를 행하는 학자는 약 40% 정도임. 일부는 이에 동의하지 않아서 거부하기도 하고, 나머지는 이런일이 일어나고 있는지도 모름.

혹시나 관심있을 사람들을 위해 이 흐름에 동참하기 위한 몇가지 research practice 들을 적어봄 (이 방법들도 완벽한건 아니고, 여러 비판이 있었음). 이들을 언급한 다는것은, 리뷰어에게 내가 open science 에 참여하고 있다는 것을 알려줌 (심리학은 확실한데, 솔직히 어느 분야까지 해당되는지는 잘 모르겠음…). 사용여부에 대한 판단은 각자가…

A. 내가 읽는 논문의 (또는 나의 논문의) validity 를 어떻게 확인할 것인가?
-시간을 되돌려 다시 2015년, Loss of confidence project 가 실행됨. 이는, 학자들이 자신이 썼던 논문중에, 스스로 생각하기에 reproducibility 에 문제가 있다고 생각하는 논문을 하나씩 추가하게끔 함 (뒤에 학자들이 그 논문을 계속 참고하여 새로운 잘못된 가설을 생산하지 못하게끔. Carney 교수가 본인의 논문결과가 잘못됐다는 것을 인정한것처럼…). 그렇게 참고자료로 쓰여지지 않도록 권고하는 논문 리스트가 만들어짐.

-2017년에 두학자가 GRIM 이라는 도구를 제안함. 이것은 논문이 리커트 척도를 사용했을때, 보고한 숫자들이 모두 수학적으로 말이 되는지 체크해줌 (말이 안되게 나오는 숫자들도 있음. 예를 들어 x 숫자의 참여자를 리커트 척도 7로 실험할때, 절대 나올수 없는 평균값이 보고되는 경우).

-P-curve (http://www.p-curve.com/app4/). 1편에서 잠깐 언급되었던 개념인데, 간단히 설명하자면, 한분야에서 p-hacking 이 아예 없다고 가정한다면, p≈0.05 와, p≈0.04, p≈0.03 등이 모두 비슷하게 분배되어있어야함. 근데 과학논문 하나하나를 체크해보면, 비정상적으로 약 0.05 인 p가 많음 (또는 분야에 따라 0.01 이거나 0.001). 이것은 이분야의 과학자들이 p-hacking 을 하고있다는 증거가됨. 이것을 한 학자로 본다면, 그의 논문 수십개중, 0.05 에 가까이있는 p 가 비정상적으로 많으면, p-hacking 을 했다는 의심을 받을 수 있음. (그 결과인지는 모르겠지만, 요즘 출판되는 논문에서는 p<0.05 로 쓰지않고, p=0.034 와 같이 정확한 값을 보고함).

참고로, 2015년 논문에 의하면, p-hacking 률이 가장 높은 세 분야는, biological sciences, medical and health sciences, psychology and cognitives sciences 로 나타남 (논문제목: The Extent and Consequences of P-Hacking in Science). 이는, 이 모든 문제가 비단 심리학계에만 적용이 되는것이 아니라는 반증이기도 함.

-그외 통계값을 계산 또는 확인하는 방법 (이미 출판된 논문으로도 확인이 가능하지만, 본인논문의 값이 맞는지 publish 전에 확인하는 용도로도 씀).
https://www.socscistatistics.com/tests/

B. 통계적 방법의 변화
1)P-value 외에도, 효과크기 (effect size) 를 보고할것
그룹 사이의 차이가 유의미하냐, 무의미하냐 = p-value.
그 차이가 얼마나 크냐, 작냐 = effect size.
이 방식은, 이미 너무 많은 사람들이 쓰고 있고, 잘 알려져 있기때문에 더이상의 설명은 패스.

2)Frequentist statistics (p-value) 을 넘어선, bayesian statistics 의 도입.
Bayesian statistics 는 여러 사용법이 있기는 한데, 그중 가장 쉽게 이해할 수 있는거는, Bayes factor임.
이 펙터는, 통계적으로 무의미한 결과가 나온다면, 왜 무의미하게 나왔는지 알려줌. 즉, 이것이 참여자가 적어서인지, 아니면 관계성이 없어서인지. 또한, 만약 참여자가 적어서라면, 그것에 대한 증거가 얼만큼 solid 한지.
그렇기에, 통계적으로 무의미한 결과도 publish 될 수 있음.


C. 어떻게 내 방법론에 문제가 없다는 것을 증명할 것인가
-뭐든 투명하게, 또 순서에 맞게 연구를 진행하는것이 기본 태도인데, 그것을 증명하는것도 못지않게 중요함.

1)Preregistration
이것은, 아직 자료를 모으기도 전에 research protocol 을 인터넷의 어느곳에 올려놓고 그에 맞는 DOI 를 부여받음으로서, 자료를 수집한후 그 어떤것도 변한것이 없음을 증명함. 부여받은 DOI 는, 조금이라도 수정이 되면 새로 부여받아야함. 다시말해, 한번 저장해서 받은 DOI 번호안에 있는 컨텐츠는 수정이안됨 (수정을 하려면 새로운 DOI 부여). 따라서 수정하려면, x의 이유로 처음 이것을 쓸때 y라는 covariate 를 추가하는것을 잊어버렸고, 이에, y라는 변수를 추가하여 수정함. 이라는 노트와 함께 새로운 DOI 를 부여받으면 됨. (다시한번 강조하는 투명함의 중요성…).

보통 research protocol 은, 윤리위원회로 부터 OK 싸인을 받을때 제출한 내용 그대로 올리기도 하고, Intro 와 Method 파트를 다 쓰고, 그것을 그대로 저장하기도함. 자료를 수집한 이후에, 미리 써놓은 인트로와 방법파트를 그대로 복사붙여놓기 해서 논문에 넣으면됨 (참고로 남들이 출판되기 전에 볼 수 없게 락을 걸어놓아야함. 락을 걸어놓으면, DOI 는 생성이 되지만, 남들은 그사이 볼 수가 없음).

이것을 올리는 사이트는 두곳이 있는데, AsPredicted (http://AsPredicted.org) 과 Open Science Foundation (OSF)(http://osf.io) 이 있는데, 후자를 더 많이 쓰는것으로 알고있음. 이후, DOI 는 출판될 논문어딘가에 집어넣으면 됨 (본 논문의 .


2)데이터의 공개
현재는, 본인이 수집한 데이터를 모두, 또는 publish 된 데이터만, 공개하는게 트렌드임. 일단 공개하기전 이름 또는 그외 그 어떠한 흔적을 남기는 정보를 삭제하고, 완전히 무기명으로 만들어야함. 이 데이터들은, 리뷰어나 에디터, 또는 다른 학자들에 의해 검증되고 또 새로운 가설을 만드는데 사용됨 (물론, 여러 ethical 문제가 제기되기도 하고, 저작권과 관련한 문제들이 나오지만, 현재의 open science 트렌드는 그럼).

Preregistration 와 같은 사이트에 올려서 데이터에 대한 DOI 를 또하나 받거나, 본인의 웹사이트에 올리기도함 (이때 학자마자, 연구에 사용된 Variables 만 공개를 하기도 하고, 데이터 베이스 전체를 공개하기도함. 전자가 더 많은 것으로 알고있음).

3)누구나 공짜로 열람이 가능한, Open access journal 에 투고
이것도 말이 많은 practice 인데, 이곳에 투고하는것이 옳다고 생각하는 학자들이 점점 많아지고 있음 (메이저 저널들은, 내가 쓴 논문을 내가 돈내고 다운받아야 하는 웃픈상황이 만들어지기도함). 문제는, 이중 대부분은 본인논문이 accept 되면, 학자 본인이 돈을 몇백만원 내야함. 대신 다운은 누구나 무료.



마치는말: 워낙 방대한 내용이라 모두 다 알지도 못할 뿐더러, 그나마 아는것조차도 다 다루지 못함. 메타사이언스 (과학 결과의 과학적 분석) 분야를 집중적으로 공부한 사람이 아니라, 그저 한 저널리스트가 쓴 학회의 흐름정도로 받아드려주셨으면 함. 실제로 쓰면서, 이걸 내가 이곳에 쓰는게 맞나 싶은 생각도 중간중간 들었음. 이런게 있었구나 하는 참고 용으로만 봐주시면 감사 하겠음. 혹시 직접 적용하게 된다면, 더 많은 자료를 확인하고 하시길.


*이상 모든 내용은 한 대학원 수업에서 다룬 내용을 토대로 쓴 것이고, 배운 내용을 한국의 연구자들과 공유하고 싶은 마음에 작성되었다는 점을 알려드립니다.

카카오 계정과 연동하여 게시글에 달린
댓글 알람, 소식등을 빠르게 받아보세요

댓글 22개

2023.03.26

감사합니다
저희 분야도 재현성이 의심되는 논문들이 많은데, (아직 통계적인 값까지 요구하는 단계도 아니긴 합니다만) 저런 재현성에 관한 지표도 의무적으로 보고하는 문화가 생기면 좋겠어요

2023.03.26

너무 재밌게 잘 봤습니다. 감사합니다.
저는 전자공학계열인데, 해외에서 포닥할 때 publish 된 논문은 raw data를 학교 측에 필수적으로 제출해야 하던게 생각나네요.
이것도 아마 말씀하신 재현성 이슈의 연장이 아니었나 싶네요.

대댓글 1개

IF : 1

2023.03.27

맞아요. 과학계의 전체적 흐름이 그러하니 어디든 적용이 될듯해요.

2023.03.27

감사합니다. 재미있게 잘 보았습니다.

2023.03.27

이런 글 더 보고싶어요. 진중하고 밀도있는 내용 감사합니다.

2023.03.27

좋은 글 읽고가요~ 통계학 관련해서 공부하다보면 늘 나오는 이슈죠... 0.05에 집착하고 목숨을 거는 현상..

2023.03.27

좋은 글 감사합니다! 앞으로도 김박사넷에 이런 글이 많아졌으면 좋겠네요

대댓글 4개

2023.03.27

사실 0.05라는 수치가 절대적인 것도 아니고, 왜 이 수치에 집착하게 되었는지 궁금하긴 합니다..! 특히나 실험연구가 아닌 사회과학 연구에서 쉽게 사용할 수 있는 분석 방법으로는 p-value를 0.05로 맞추기가 쉽지 않을 것 같은데요... 오히려 p-value에 집착하다보니 흥미로울 수 있었던 결과들도 사장되지 않았을까 하는 생각이 드네요

IF : 1

2023.03.28

왜 0.05이고, 왜 p-value 에 집착하였는지에 대해 쓰려면 또 한페이지가 나오겠지만, 사실 0.05의 수치는 선생님 말씀대로 임의적인 수치입니다. 심지어 사회과학분야에서 생겨난 수치도 아니고, 뜬금없는 농업분야의 연구소에서 Fisher 가, 어떤 리서치 research question 을 다시한번 확인해볼 가치가 있냐 없냐 정도의 척도로 사용했어요 (오늘날의 통계적 유의미, 무의미와는 전혀 다른 개념이죠). p<0.05 가 나오면, "어쩌면" 뭐가 있을 수 있으니, 더 많은 연구를 해봐야겠다 정도의 수준이었습니다. 이후, Neyman 과 Pearson 가 허위양성, 허위음성이라는 개념을 추가하고, 이 세 학자 끼리 서로 학문적으로 치고받고 싸우기 시작합니다. 싸우기만 하고 결론이 안나오니, 통계전문가가 아닌 다른 연구자들이 그들의 개념들을 합쳐서 만든 모델이 오늘날 사용된다고 보시면 됩니다. 그리고 더 최근에는, 말씀하신 "집착" 으로부터 자유로워지기 위해, Bayes factor 같은, 보안할 수 있는 개념들이 권장되는것 같습니다. 어떤 심리학저널들은, p 를 사용하면 무조건 리젝이라고 선언하기도 했고요.

2023.03.29

댓글마저 유익하네요..! 이걸로 글 하나 더 쓰셔도 좋은 글 나올 것 같습니다 ㅎㅎ 통계 전공하면서도 항상 궁금했던 부분이었어요!

2023.12.14

Fisher 는 뜬금없는 농업분야의 연구소 사람이라기 보다 통계학의 대부입니다. 작물 성장 관련된 실험을 하면서 분산분석, 실험계획법 그리고 통계 검정에 대한 기반을 다지셨죠..

2023.03.28

좋은 글 감사합니다~

2023.03.28

좋은 글 감사합니다. 새로운 내용을 많이 알게 되네요!

2023.03.28

재밌네요!!

2023.03.28

재밌게 읽었습니다. 어떤수업인지 알려주실 수 있나요? 더 찾아보고 싶네요.

대댓글 2개

IF : 1

2023.03.29

아쉽지만, 수업의 컨텐츠가 인터넷에 올라와있지는 않아요. ㅠ
조금더 알고 싶으시다면, 본 글에서 언급한 Nelson, L. D., Simmons, J., & Simonsohn, U. (2018). Psychology's renaissance. Annual review of psychology, 69, 511-534. 이 논문을 추천드릴게요. 구글 스콜러에 치면 나와요.

2023.04.26

위 글과 관련된 내용의 책도 하나 추천드리고 싶습니다. 사이언스 픽션:과학은 어떻게 추락하는가. 라는 저서에서도 심리학계에 불어닥친 재현성 문제와 p value가 왜 쓰이게 됬는가에 대해서도 나옵니다. 흥미롭게 본 책이라서 본문 내용의 연장선으로 읽어보셔도 좋을것 같습니다.

2023.03.29

재밌게 읽었습니다!

2023.05.21

2편에서 심리학분야는 200년대 초반까지만해도 저랬나 하다가...3편에서 의학에서도 저렇다는 글을 보고.. 좀 이상하다고 생각함. 아카데미아에선 그럴 수 있을지 몰라도... 산업계 임상개발에선 다름

2023.05.29

잘봤습니다~

2023.06.11

매우 재미있게 잘 봤습니다! 흥미롭네요 ㅎㅎ. 저는 물리쪽 분야라 생물쪽 논문을 써본적이 없지만 개인적으로 생물쪽 논문에 대한 무수한 괴담? 을 많이 들었었는데 역시 수치적으로 뭔가 나오네요 ㅋㅋ 글 써주셔서 감사합니다

2023.11.03

와 김박사넷에서 본 글 중에 가장 유익한 글 !

댓글쓰기

게시판 목록으로 돌아가기

김박사넷의 새로운 거인, 인공지능 김GPT가 추천하는 게시물로 더 멀리 바라보세요.

자유 게시판(아무개랩)에서 핫한 인기글은?

자유 게시판(아무개랩)에서 최근 댓글이 많이 달린 글

🔥 시선집중 핫한 인기글

최근 댓글이 많이 달린 글