https://zero-base.co.kr/category_data_camp/school_DS 미리 5개월이 끝났다. 시간이 너무나 빠른 듯 안빠른 듯 빠른…(?)
1. 성죽 도약 상황
고여있는 물을 감지하는 프로젝트를 진행하고 있다. 수지 프로젝트는 민형기 강사님께서 기업과 연계해서 진행하는 프로젝트인데, 이슈가 살짝 있었다. 프로젝트에 관청 입담 설명하자면, 자초 치과 의료용 살림살이 개발을 위해서 가루 안에 있는 침과 피를 detection하는 프로젝트였다. 다른 한편 친권 안의 침과 피를 찍은 데이터셋을 구하기 어려워 깔색 웅덩이를 이미 detection하고 이후에 기업 측으로부터 데이터셋을 받아서 일삽시 더욱더욱 진행해볼 여지가 있는 프로젝트였다. 더욱이 빛깔 웅덩이를 감지하는 모델을 만들면, 다른 곳에서도 쓰일 곳이 많아(예로 공장 바닥에 있는 물을 감지하여 청소하는 기계 개발 등) 이렇게 진행하게 되었다. 그래서 데이터셋을 구할 철 여러 경향 웅덩이 영상이 있었지만, 치과에서 사용하기 위해서는 침이 투명해서 치아와 혀가 모조리 비치니, 물이 투명한 게 백분 드러나는 데이터셋을 구해야겠다고 생각했다. 고로 유튜브에서 구한 물이 굉장히 투명한 갯바위 영상으로 진행했다. 물이 굉장히 투명해서 라벨링을 하는 동안에도 이게 돌인지 물인지 나조차도 구분이 안되어서 걱정이 많았다. 약 2주 나간 라벨링을 진행했다. labelme를 사용하였고, 거의 2주동안 점만 찍어대니 손목이 시큰거렸다… (이래서 3d라고 하는구나.. 뼈져리게 느끼며…^^…..) 그런데..! 라벨링이 결어 되었을 때 기업이 바뀌었다는 소식을 들었다..! 바뀐 기업의 목표는 도로에 있는 물을 감지하는 것이었고, 생각해보면 영상에서의 물이 투명할 필요가 없을 것 같은……(도로에 있는 물은 마른 바닥에 비해서 색이 오죽 일층 진하므로…) 그대로 라벨링을 남김없이 진행했기 왜냐하면 어쨌든 독해 놓은 데이터셋으로 일단 진행하고 있다. 경향 웅덩이를 감지하는 건, 나절 웅덩이의 형태가 고정되어 있지 않기 그렇게 난이도가 좀 있는 편이라고 했다. 거기다가 우리 팀 영상은 가일층 난이도가 있다. 그러므로 모델이 으레 탐지할 생령 있게 만들면 도리어 좋은 거 아닐까?ㅎㅎ… 현재까지는 영상이 아니라 영상에서 프레임별로 추출한 사진 데이터로 이미 진행했다. 물론 IOU나 mAP로 본 결과는 좋지 않지만, 대부분 감지하는 걸 보고 감사했다… 라벨링하면서 호위호 걱정했는지ㅠㅠㅠㅠㅠ 사용한 모델은 Faster RCNN, Mask RCNN이었고, 이후 U-Net으로도 어떤 차례 해보고 싶은데 어떻게 될지 모르겠다. MMDetection으로 진행했는데, 얘한테는 U-Net이 없어서 backbone 작업을 해야하고, MMSegmentation으로 진행하려면 현세 사용한 Coco 데이터셋을 변환시켜야한다. 암튼 앞으로 영상으로도 해보고, 현재는 epoch를 12번밖에 중간 돌렸는데, 파라미터 조정도 해보고 epoch도 늘려서 성능을 일삽시 더한층 개선하는 방법들을 찾아봐야할 것 같다.2. EDA Test
이번 달에도 간절히 EDA Test가 있었다. 문제는 전과 동일하게 슬랙으로 배포되고 문제를 푼 이다음 아울러 준 파이썬 파일을 이용해 채점을 진행한 기극 제출하는 형식이다. 프로젝트로 정신없는 와중에 테스트가 있었기 때문에, 솔직히 금번 고사 은밀히 안하고 넘길까 고민을 엄청했다. 근데 왜인지 안하고 넘어가기엔 찝찝한..? 그러면 일단 해보고 시간이 무지 동안 걸리면 패스하자, 하고 풀기시작했는데.. 역시나 집사람 풀리면 끝까지 잡고 있는 버릇이 나왔다..ㅋㅋㅋㅋㅋㅋㅋ 중간에 문제에서 groupby한 최후 해결해야하는 문제가 나왔는데, 이전부터 멀티 인덱스를 곧장 다루지 못했기 그렇게 오기가 생겨서 구글링 엄청하고 요것조것 시도해보았다. 그러다가 원리가 이해되면서 풀리는 순간..! 환희와 기쁨…ㅋㅋㅋㅋㅋ 이래서 코딩하지ㅠㅠㅠㅠㅠ3. 커리어 서비스
9월 말에 커리어 상담 서비스가 시작됐다. 두 가지를 제공하는데,- 박신영 코치의 이소서 첨삭
- 2명의 시험 면접관과 상시 면접 진행