분석시각화 대회 코드 공유 게시물은
내용 확인 후
좋아요(투표) 가능합니다.
[Baseline] TfidfVectorizer + LogisticRegression
안녕하세요. 데이콘입니다.
해당 베이스라인은 모든 참가자의 '제출'을 목표로 하며,
첫 번째 당사자(first_party)와 두 번째 당사자(second_party)의 정보 그리고 사건 내용(facts)으로부터 단순히 이진분류하는 방식으로 구현되어 있습니다.
그러나 이번 대회의 주요 과제를 해결하기 위해서는 보다 더 구체적이고 논리적인 방식이 필요할 수 있을 것 입니다.
베이스라인이 여러분만의 고도화된 모델 작성에 도움이 되면 좋겠습니다.
감사합니다.
데이콘 드림
Data Preprocessing 코드를 실행하지 않은 것은 아닐까요?
전체 코드를 다시 한번 실행해보시죠
저도 같은 에러가 발생합니다!
```python
X_train = np.asarray(X_train)
Y_train = np.asarray(Y_train)
model = LogisticRegression()
model.fit(X_train, Y_train)
```
```python
X_test = np.asarray(X_test)
pred = model.predict(X_test)
```
이런 식으로 `np.asarray` 활용해보세요.
제출시에 submission 양식처럼 first party win에 1 또는 0으로 값이 저장되고 제출하면 채점이 되어야 하는 것 아닌가요?? 왜 점수가 조금도 바뀌지 않는지 궁금합니다
DACON Co.,Ltd | CEO Kookjin Kim | 699-81-01021
Mail-order-sales Registration Number: 2021-서울영등포-1704
Business Providing Employment Information Number: J1204020250004
#901, Eunhaeng-ro 3, Yeongdeungpo-gu, Seoul 07237
E-mail dacon@dacon.io | Tel. 070-4102-0545
Copyright ⓒ DACON Inc. All rights reserved
```
model = LogisticRegression()
model.fit(X_train, Y_train)
```
위 코드에서 model.fit() 돌릴 때 에러 발생합니다. (colab 환경)
TypeError: np.matrix is not supported. Please convert to a numpy array with np.asarray.