AI, 대학 연구 패러다임 바꾼다…교수진 71.5% "윤리적 고려 최우선"
대학 연구현장의 AI 도입 실태와 도전과제
Social Sciences & Humanities Open 최신호에 발표된 연구에 따르면, AI 기술이 대학의 연구 환경을 크게 변화시키고 있는 것으로 나타났다. 페루의 공립 및 사립대학 연구자 302명을 대상으로 진행된 이번 연구는 연구자들의 AI 모델 사용에 영향을 미치는 핵심 요인들을 분석했다. 특히 챗GPT(ChatGPT)와 같은 대규모 언어모델부터 리서치래빗(ResearchRabbit), 스코퍼스AI(ScopusAI)와 같은 전문 연구도구까지 다양한 AI 도구들의 활용 현황을 조사했다. 설문 응답자의 62.33%가 국립대학 소속이었으며, 37.7%는 사립대학 소속으로 나타났다.
AI 도구의 특성에 따라 달라지는 연구자의 태도
연구진은 AI 도구들의 성능을 정확성, 정밀도, 재현율, F1 점수 등 핵심 지표를 통해 평가했다. 이러한 성능 차이는 학술 연구에 직접적인 영향을 미치는 것으로 나타났다. 예를 들어, 높은 정확도를 보이는 표절 감지 AI는 학문적 진실성 향상에 기여하지만, 불완전한 생성형 모델은 연구의 질을 저하시킬 수 있다는 점이 확인됐다. 또한 AI 도구의 특성에 따라 연구자들의 수용 태도가 크게 달라지는 것으로 분석됐다. 특히 도구의 용도, 성능 품질, 대상 사용자에 따라 채택 정도가 다르게 나타났다.
AI 수용성의 핵심 결정요인은 ‘학문적 진실성’
연구 결과에 따르면 연구자들의 AI 도입을 결정하는 가장 큰 요인은 학문적 진실성(Academic Integrity)으로, 전체 변량의 71.5%를 설명하는 것으로 나타났다. 특히 AI 활용에 대한 윤리적 고려가 기술적 역량보다 더 중요한 요인으로 작용했다. 학문적 진실성은 연구와 교육에서 윤리적 원칙과 연구 재현성, 데이터 무결성을 유지하고, 학문적 부정행위를 방지하는 것을 의미한다. 특히 AI 도구의 사용이 표절, 부정행위, 데이터 조작 등의 윤리적 문제를 초래할 수 있기 때문에, 학문적 진실성은 AI 사용을 규제하고 책임 있는 활용을 보장하는 데 중요한 요인으로 간주된다.
이외에도 교육적 자기효능감(Educational Self-efficacy)은 두 번째로 강한 영향력을 보였으며, 사회적 영향(Social Influence)은 작지만 유의미한 영향을 미치는 것으로 분석됐다. 주목할 만한 점은 기존 연구에서 중요하게 여겨졌던 성과 기대감(Performance Expectancy)과 기술적 자기효능감(Technical Self-efficacy)은 유의미한 영향을 미치지 않는 것으로 나타났다.
연구자 78.2%, AI 활용이 윤리적 인식에 영향 미쳐
연구진의 AI 활용은 교수자들의 우려사항과 윤리적 인식에도 큰 영향을 미치는 것으로 나타났다. AI 활용 경험이 많을수록 윤리적 고려사항에 대한 인식도 높아지는 것으로 확인됐다. 연구자의 65.2%는 AI 활용이 교육 현장의 우려사항을 증가시킨다고 응답했으며, 78.2%는 AI 활용이 윤리적 인식에 영향을 미친다고 답했다. 특히 알고리즘의 투명성 부족, 윤리적 편향성, 데이터 프라이버시 문제가 주요 우려사항으로 지적됐다.
연구의 방법론적 신뢰성 ‘양호’
이번 연구의 방법론적 타당성은 여러 통계적 지표를 통해 검증됐다. G*Power 3.1 소프트웨어를 통한 사전 분석에서 최소 필요 표본 크기는 278명으로 산출됐으며, 실제 수집된 302명의 표본은 이를 충족했다. 구조방정식 모델의 적합도 또한 SRMR과 RMSEA 값이 모두 0.048로 기준치를 충족했으며, CFI 0.938, TLI 0.928 등의 지수도 양호한 수준을 보였다.
AI 활용에 가장 부정적 영향을 미치는 건 ‘사용 용이성에 대한 기대감’
연구 참여자의 상세 구성을 보면 독립 연구자가 33.3%(100명), 교수 및 시니어 연구자가 5.7%(17명), 박사 후 연구원이 1.3%(4명), 연구 관리자가 0.3%(1명)를 차지했다. 연구진이 설정한 9개의 가설 중 6개가 통계적으로 지지됐다. 특히 주목할 만한 결과로 사용 용이성에 대한 기대감(EE)이 AI 활용에 부정적 영향(β = -0.237)을 미치는 것으로 나타났으며, 학문적 진실성은 가장 강한 긍정적 영향(β = 0.782)을 보였다. 사용 용이성에 대한 기대감은 구체적으로, 사용자가 AI 모델을 배우고 활용하는 데 필요한 노력 수준을 얼마나 쉽게 인식하는지를 나타낸다. 연구에 따르면, EE가 낮을수록, 즉 AI 모델이 더 쉽게 사용 가능하다고 느낄수록 사용 의도가 증가한다.
또한, AI 모델 사용이 교수자의 우려에 미치는 영향(β = 0.273)과 인지된 윤리에 미치는 영향(β = 0.556)도 통계적으로 유의미했다. 전체적으로 설명력을 나타내는 R² 값은 AI 모델 사용(USAI) 71.5%, 인지된 윤리(PETH) 78.2%, 교수자 우려(TC) 65.2%로 나타나 모델의 높은 설명력이 입증됐다.
라틴 아메리카 맥락의 특수성과 시사점
이번 연구는 신흥 경제권인 페루의 고등교육 맥락에서 AI 도입의 특수성을 보여준다. 연구 참여자의 연령대를 보면 29-33세가 38.07%로 가장 많았고, 대학원생이 59.3%를 차지해 신진 연구자들의 AI 활용 양상을 잘 보여준다. 챗GPT 사용 기간은 1-2개월이 35.2%로 가장 많았고, 3-5개월이 24.9%로 그 뒤를 이었다. 이는 지역적, 문화적 특수성이 AI 수용에 미치는 영향을 보여준다. 연구진은 향후 연구에서 기관의 정책적 맥락과 문화적 차이를 고려한 더 폭넓은 분석이 필요하다고 제언했다. 특히 신흥 경제권에서 윤리적 프레임워크가 아직 발전 중인 점을 고려할 때, AI 도입에 있어 윤리적 고려사항이 더욱 중요하다고 강조했다.
■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT-4o를 활용해 작성되었습니다. (☞ 논문 바로가기)