[자연어처리] 패딩(Padding) : 길이 지정 방법 - maxlen (파이썬)
이전 글들에서 패딩을 하는 기본적인 방법과, 제로 패딩을 할 때 0을 뒤로 채우는 방법 등에 대해서 살펴보았는데요, 이번에는 패딩을 할 때, 길이를 지정하는 방법에 대해서 살펴보도록 하겠습니다. 먼저, 기본적으로 패딩을 하는 코드를 작성하고, 그 결과를 보겠습니다. import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer sentences = [['place', 'tree'], ['tree', 'nice', 'green'], ['nice', 'sky', 'and', 'tree'], ['bird', 'tree']] tokenizer= Tokenizer() tokenizer.fit_on_texts(sentences) encode..
더보기
[파이썬] 리스트 길이만큼 for문 반복하기
코딩을 하다 보면, 리스트에 있는 데이터의 수만큼 for문을 반복하는 경우가 많은데요, 데이터 항목의 길이를 구하는 len() 함수를 이용하면 쉽게 표현할 수 있습니다 list1 = [15, 34, 64, 37, 83, 25, 62, 98, 46] 먼저, 위와 같이 9개의 숫자 데이터를 담고 있는 list1 가 있고, 이 리스트 안에 있는 값을 차례로 출력하고 싶다면 for문을 사용하면 되는데요, 이때 for문에는 반복할 범위(range)를 지정해주어야 합니다. 9번을 반복하면 되기 때문에 아래와 같이 코드를 작성해도 되지만, 데이터가 너무 많아 그 길이를 알 수 없을 수 있습니다. for i in range(9) : print(list1[i]) 따라서 len() 함수를 이용하면 되는데요, len() 함..
더보기