안녕하세요

이번 AI 스터디 참가를 하려고 합니다만, 답글을 늦게 적어서 조를 배정을 받지 못했습니다.

서울 대림동에 살고 있습니다.

 

물리학을 전공했고 반도체회사에서 불량분석일을 하다 그만 두었고 1년전쯤 Machine Learning (Neural Network)를 이용한 프로그램을 만들어 보다 한계에 부딪혔습니다. 책을 보면 "잘" 될것 같은데 막상 잘 되지 않더군요. 스터디를 하고 실전을 하다 보면 분명 비슷한 문제가 생길 것 같아서 사전에 미리 알고 있는 내용을 공유 드리려 합니다.

 

Neural Network기준으로 아는 데로 설명을 드리자면 만드는 것은 어렵지가 않습니다만, 위에서 말한것 처럼 "잘" (원하는 성능치)를 내기위해서는 생각보다 고려해야 할 부분이 많이 발생 하는 것 같습니다.

 

가장 큰 문제가 Input에 사용할 Data 형태 및 개수 인것 같습니다. (제가 실패한 부분도 Data의 전체 개수가 너무 작아서 문제가 발생한 것 같습니다.) 이게 치명적일 수 있는 이유가 Deep Learning을 하려면 Node의 개수가 많아 지기때문에 Data의 양이 적으면 최적화를 할 수 조차 없는 경우가 발생하는 것 같습니다. - 저도 공부를 깊게 하지는 않아서 Node와 Layer당 얼마만큼의 Sample이 필요한지 수치적으로는 잘 모르겠습니다. -

 

만약 AI스터디가 Deep Learning쪽으로 진행이 된다면 아마도 해외 Competition Site의 문제 중에서 재미있는 문제의 Data Set을 받아서 하는 것이 어떨까요? ( 물론 Data를 가공하는 일도 매우 중요해 보입니다만... , Data를 어떻게 처리하는 지가 더 중요할 것 같아서 제안 드립니다.)

 

예전에 본 사이트가 https://www.kaggle.com/competitions

인데요 꼭 이사이트가 아니더라도 유명? 권위? 있는 기관에서 하는 Competition이면 아무거나 가능 하지 않을 까 싶습니다.

덤으로 만든 Neural Network도 평가도 해주니깐요.

 

읽어 주셔서 감사합니다. 다음주에 스터디에서 뵈어요.

최선근 드림

XE Login