NumPy 데이터 추출에 대해 질문드립니다.

2022.12.06 23:14 1,430 조회

첫 프로젝트 작업 중에 궁금한 것이 생겨서 질문 남깁니다.

image preprocessing 작업이 꽤 오래 걸려서 preprocessing이 끝나고 image 정보가 담긴 4D NumPy array를 to_csv처럼 따로 파일을 만들어서 다른 Notebook에서 모델링 작업을 하고 싶은데 가능한 방법이 있을까요?

아니라면 image를 경로에서 가져오면서 resize까지 하는 과정을 아래 코드보다 더 빠르게 할 수 있나요? 코랩에서 33분 정도 걸리더라고요.

from tensorflow.keras.preprocessing import image


train_set = []


for i, f in enumerate(train_list):
    img = image.load_img(f, target_size = (224, 224, 3)) # 반환형 <class 'PIL.Image.Image'>
    print('count {}'.format(i))
    img_np = np.array(img)
    train_set.append(img_np)
로그인이 필요합니다
0 / 1000
재애애영
2022.12.07 15:27

삭제된 댓글입니다

파이썬초보만
2022.12.09 23:08

numpy 배열저장은 np.save나 np.savez를 이용하시는게 어떨까요?

전처리를 빨리 하는 방법으로는 multiprocessing을 사용하시면 좋을 것 같습니다

Doby_
2022.12.22 22:44

답변이 늦었습니다! 알려주셔서 감사합니다. save를 통해 원하는 방향으로 작업하고 있습니다.
multiprocessing에 대해서도 알아봐야겠네요! 감사합니다!

nana244
2022.12.13 09:58

삭제된 댓글입니다

nana244
2022.12.13 10:47

삭제된 댓글입니다