분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NumPy 데이터 추출에 대해 질문드립니다.
첫 프로젝트 작업 중에 궁금한 것이 생겨서 질문 남깁니다.
image preprocessing 작업이 꽤 오래 걸려서 preprocessing이 끝나고 image 정보가 담긴 4D NumPy array를 to_csv처럼 따로 파일을 만들어서 다른 Notebook에서 모델링 작업을 하고 싶은데 가능한 방법이 있을까요?
아니라면 image를 경로에서 가져오면서 resize까지 하는 과정을 아래 코드보다 더 빠르게 할 수 있나요? 코랩에서 33분 정도 걸리더라고요.
from tensorflow.keras.preprocessing import image train_set = [] for i, f in enumerate(train_list): img = image.load_img(f, target_size = (224, 224, 3)) # 반환형 <class 'PIL.Image.Image'> print('count {}'.format(i)) img_np = np.array(img) train_set.append(img_np)
numpy 배열저장은 np.save나 np.savez를 이용하시는게 어떨까요?
전처리를 빨리 하는 방법으로는 multiprocessing을 사용하시면 좋을 것 같습니다
답변이 늦었습니다! 알려주셔서 감사합니다. save를 통해 원하는 방향으로 작업하고 있습니다.
multiprocessing에 대해서도 알아봐야겠네요! 감사합니다!
삭제된 댓글입니다
삭제된 댓글입니다
데이콘(주) | 대표 김국진 | 699-81-01021
통신판매업 신고번호: 제 2021-서울영등포-1704호
서울특별시 영등포구 은행로 3 익스콘벤처타워 901호
이메일 dacon@dacon.io | 전화번호: 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
삭제된 댓글입니다