[데이터 리뷰] 해양수산 플랫폼(2) - 어업별 어선 조업 위치, 어획량, 조업 정보 데이터
데이터 리뷰 : 데이터 대신 읽어드립니다! #11 해양수산 플랫폼(2) - 어업별 어선 조업 위치, 어획량, 조업 정보 데이터 우리나라 동해, 서해, 남해에서는 참 많은 어업 활동이 이루어지고 있고, 다양한 어선 조업 등을 통해 어획 및 생산활동이 이루어지고 있습니다. 이와 관련해서 에서는 어업과 관련한 데이터를 제공하고 있는데요, 그중에서도 어업별 어선 조업의 위치, 어획량 정보, 조업 정보에 대한 데이터가 있답니다. 따라서 이번 데이터 리뷰기에서는 해양수산 플랫폼의 '어업별 어선 조업 위치', '어업별 어획량 정보', '어업별 조업 정보' 데이터를 함께 읽어보고, 어떻게 분석하고 활용할 수 있을지 생각해보도록 하겠습니다~! 1. 어업별 어선 조업 위치 데이터 (1) 데이터 정보 제공기관 : 전자어구빅..
더보기
[머신러닝] CNN 층에 dropout(드롭아웃) 추가하기 (텐서플로)
Dropout(드롭아웃)은 랜덤으로 선택한 node만 학습시키고, 일부 node는 버리는 것을 말하는데요, 한 번의 학습 후 다음 학습 때 이 과정을 반복합니다. Dropout을 사용하면 은닉층이 많은 neural network에서 오버피팅 문제를 방지할 수 있다는 장점을 가지는데요, 텐서플로를 이용하여 만든 CNN 층에 드롭아웃 층을 추가하는 코드에 대해서 살펴보겠습니다. model = models.Sequential() model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1))) model.add(layers.MaxPooling2D((2, 2))) model.add(layers.Conv2D(64, (3, 3), act..
더보기
[자연어처리] 패딩(Padding) : 0을 뒤에 채우는 방법 (파이썬)
지난 글에서는 파이썬에서 패딩을 구현하는 기본적인 방법에 대해서 알아보았는데요, pad_sequences() 함수를 이용하여 패딩을 구현했습니다. 아래 코드처럼 pad_sequenes()를 이용하여 코드를 입력하면 기본적인 패딩이 되는데요, import numpy as np from tensorflow.keras.preprocessing.text import Tokenizer sentences = [['place', 'tree'], ['tree', 'nice', 'green'], ['nice', 'sky', 'and', 'tree'], ['bird', 'tree']] tokenizer= Tokenizer() tokenizer.fit_on_texts(sentences) encoded = tokenizer...
더보기