분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
NumPy 데이터 추출에 대해 질문드립니다.
첫 프로젝트 작업 중에 궁금한 것이 생겨서 질문 남깁니다.
image preprocessing 작업이 꽤 오래 걸려서 preprocessing이 끝나고 image 정보가 담긴 4D NumPy array를 to_csv처럼 따로 파일을 만들어서 다른 Notebook에서 모델링 작업을 하고 싶은데 가능한 방법이 있을까요?
아니라면 image를 경로에서 가져오면서 resize까지 하는 과정을 아래 코드보다 더 빠르게 할 수 있나요? 코랩에서 33분 정도 걸리더라고요.
from tensorflow.keras.preprocessing import image train_set = [] for i, f in enumerate(train_list): img = image.load_img(f, target_size = (224, 224, 3)) # 반환형 <class 'PIL.Image.Image'> print('count {}'.format(i)) img_np = np.array(img) train_set.append(img_np)
numpy 배열저장은 np.save나 np.savez를 이용하시는게 어떨까요?
전처리를 빨리 하는 방법으로는 multiprocessing을 사용하시면 좋을 것 같습니다
답변이 늦었습니다! 알려주셔서 감사합니다. save를 통해 원하는 방향으로 작업하고 있습니다.
multiprocessing에 대해서도 알아봐야겠네요! 감사합니다!
Deleted Comment
Deleted Comment
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io |
Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
Deleted Comment