분석시각화 대회 코드 공유 게시물은 
 내용 확인 후 
      좋아요(투표) 가능합니다.
    
NumPy 데이터 추출에 대해 질문드립니다.
첫 프로젝트 작업 중에 궁금한 것이 생겨서 질문 남깁니다.
image preprocessing 작업이 꽤 오래 걸려서 preprocessing이 끝나고 image 정보가 담긴 4D NumPy array를 to_csv처럼 따로 파일을 만들어서 다른 Notebook에서 모델링 작업을 하고 싶은데 가능한 방법이 있을까요?
아니라면 image를 경로에서 가져오면서 resize까지 하는 과정을 아래 코드보다 더 빠르게 할 수 있나요? 코랩에서 33분 정도 걸리더라고요.
from tensorflow.keras.preprocessing import image
train_set = []
for i, f in enumerate(train_list):
    img = image.load_img(f, target_size = (224, 224, 3)) # 반환형 <class 'PIL.Image.Image'>
    print('count {}'.format(i))
    img_np = np.array(img)
    train_set.append(img_np)
numpy 배열저장은 np.save나 np.savez를 이용하시는게 어떨까요?
전처리를 빨리 하는 방법으로는 multiprocessing을 사용하시면 좋을 것 같습니다
답변이 늦었습니다! 알려주셔서 감사합니다. save를 통해 원하는 방향으로 작업하고 있습니다.
multiprocessing에 대해서도 알아봐야겠네요! 감사합니다!
Deleted Comment
Deleted Comment
      DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
      
      Mail-order-sales Registration Number: 2021-서울영등포-1704
      
      Business Providing Employment Information Number: J1204020250004
      
      #901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
      
      E-mail dacon@dacon.io |
      Tel. 070-4102-0545
      
      Copyright ⓒ DACON Inc. All rights reserved
    
Deleted Comment