- 데이터를 불러온다.
- 변수 지정해서 거기에 파일 넣어주기
- Train=pd.read_csv(“파일 경로”)
- Test=pd.read_csv(“path”)
- 질문
- import os 했는데 저건 어디에서 쓰는거지?
- Read_csv 는 어떤 함수지?
- 코드 맨 앞에 선언되어 있는 부분은 무슨 용도지?
- 파일 열어보기
- Train -> csv 파일이 열림
- Train[“count”] : 해당 열만 보여줌.
- Series : 행이 하나일 때
- Data frame : 행이 여러개 일때
- 질문 : 그러면 행만 보여줄 때는 어떻게?
- 질문
- 명령어도 없이 그냥 변수 이름만 치면 원래 파일이 열리나? 변수 값이 나오는건 알겠는데 이거는 파일을 열어야 하는 문제인데 함수가 따로 필요 없는거야?
- 파일 비교해서 전처리 방법 생각하기
- Test data set, train data set 을 비교해서 어떤 데이터가 다른지를 확인.
- 테스트에서 빠져있는 컬럼(열)이 우리가 찾아야 할 값.
- 변수 지정해서 거기에 파일 넣어주기
- 전처리를 한다. : 모델이 받아들일 수 있는 형태로 처리
- 숫자 데이터로 바꾼다.
- 일단 데이터셋에 들어있는 데이터타입을 확인해야지
- Train.dtypes
- 숫자만 남기자
- 문자형을 숫자로 변환
- 문자형을 제거
- Train.drop([“datatime”, “casual”])
- Train.drop(train.iloc[:,0])
- Index라고 해서 첫줄 숫자는 열로 포함되지 않는다.
- 질문 : 저거 iloc 함수 어떻게 쓰는건지 모르겠네
- 그냥 제거만 하는 게 아니라 제거한 애를 다른 변수에 넣어줘야지.
- Train2=train.drop([“datatime”,”casual”,”registered”,”count”],1)
- Test2=test.drop([“datatime”],1)
- 질문 : 저기 뒤에 1은 왜 붙이는 거지?
- 질문
- .dtypes 이 명령어는 어떤 라이브러리에서 나온거지? 파이썬 자체 명령어인가? 변수 뒤에 붙이면 자동으로 데이터 타입을 분석해 주는 함수인가?
- 모든 모델은 숫자 데이터만 받을 수 있나?
- 각 모델이 어떤 데이터를 가장 잘 받아들이는지는 어떻게 알 수 있지?
- 일단 데이터셋에 들어있는 데이터타입을 확인해야지
- Test set, train set 의 차원을 일치시킨다.
- 나머지는 제거해준다.
- 숫자 데이터로 바꾼다.
- 모델에 학습시킨다.
- Sklearn : 모델들이 들어있는 라이브러리
- Ensemble : random forest 에서 사용해야 하는 기법
- From sklearn.ensemble import randomforestregressor
- 함수를 불러온다.
- Rf=randomforestregressor()
- 질문: 함수도 변수에 저장해서 써야되는거야?
- 학습시킨다.
- Rf.fit(train2,train[“count”])
- Rf 모델이 train set 에 맞게 학습되었다.
- 질문 : 그런데 이거는 학습 결과 학습 모델은 따로 저장 안해?
- 데이터에 맞는 적절한 모델을 선택하여 학습시킨다.
- 하이퍼파라미터 튜닝을 통해서.
- 데이터를 얼마나 잘 전처리 했는지.
- 질문
- 모델을 학습시키는 거야 아니면 Train set 을 학습시키는 거야? Train set 에 맞게 모델을 학습시키는 거야? 근데 모델은 이미 정해져 있는 거라며?
- Sklearn.ensemble 이 문법은 무슨 뜻이야?
- Randomforest regressor 는 무슨 모델이야?
- 데이터 예측의 관건은 모델을 어떻게 사용하느냐 인거야? 이거의 차이는 어디서 오는거야?
- 예측한다.
- Result=rf.predict(test2)
- Result
- Count 열만 출력된다.
- Rf.fit(train2, train[“count”[) 형식이니까 (인풋양식, 아웃풋 양식) 이런 순인 것 같다.
- 원본 데이터와 합쳐서 보여준다.
- Test[“count”]=result
- Count 라는 열을 하나 만들어서 result 값을 넣으라는 뜻
- Test : 원본 테스트 데이터셋에 예측 결과가 합쳐져서 프린트 된다
- 테스트 제출은 어떻게 하는거지?
Month / 2020 4월
[소설] 채식주의자(한강)
이런 류의 소설을 읽을 때면 약간 불편한 구석이 있다. 인간의 어두운 모습? 추악한 모습? 동물적인 본능에 따른 모습들을 볼 때면. 이런 모습이야 말로 사실 인간 본성, 깊숙한 곳에서 나오는 자연의 모습일 텐데.
왜냐면 일상생활에서 우리가 만나는 사람들. 정상적 이잖아. 그런 사람들을 보다가, 소설 속에서 영혜와 같은 사람들, 혹은 그의 언니, 그의 남편의 이야기를 듣고 있으리라면, 그들의 내적 고뇌와 감정들을 들여다 보는 것은 인생에 대해서 생각해 보기 좋은 영감들이지만, 또 한편으로는 불편한 마음이 드는 것은 어쩔 수 없는 것 같다.
나의 경우는 인간의 동물적인 모습을 고3때, 혼자서 괴로워 했던 그 시절에 느꼈다. 그냥 정상적이라고 볼 수 없는 행동들. 이불 속에 파붙혀서 숨죽여 소리를 질렀다 정신적으로 힘겨웠던 날들.
하지만 여전히 이런 소설들을 받아들이는 것은 어렵다. 정신적으로 문제가 있는 사람의 이야기. 정신적으로 문제가 있다는 것. 은연 중에 나와 관련 없응 이야기야. 하는 생각이 들어서 그런 것 같다. 현실감이 없어서. 그것은 그런데 사실 멀리 있는 것이 아니고 내 안에 이미 있는 것인데. 우리 모두 인간으로써 동물적 본성을 가지고 있다. 그런데도 왠지 모르게 괴리가 느껴지고 불편한 감정이 드는 것은 왜일까. 그런데도 왜 이성적 사고를 버리고 동물스럽고 자연적인 모습을 바라보는 게 불편하게 느껴질까?
채식을 한다는 것. 옷을 입지 않은 상태가 편하다는 것. 햇빛에 자신을 맡긴다는 것. 음식은 필요 없고 물만 있으면 살 수 있다는 것. 살 필요가 없다는 것. 물구나무를 서면 팔에서 뿌리가 자라나고 나무가 될 수 있다는 것. 그리고 이런 영혜를 바라보는 주변 사람들. 간신히 버티는 사람들.
인간이 너무 힘들어지면 그렇게 되는걸까? 그럼 사실 애써서 이성을 붙들고 있었던 걸까? 인간은 힘들다. 그래서 . 음 어쩌면 자연을 거스르고 물질적 만족을 얻기 위해 욕심을 부리고 산업을 키우고 사회를 고도화 시켜가면서 나가 떨어져 가는 사람들. 그들은 버겹다. 개인의 노력과 성과를 강조하는 사회. 직업적 능력이 없으면 경쟁에서 밀려나는 사회. 그래서 자연으로 돌아가고 싶어졌을까? 자연에서 나온 인간을 사회는 점점 자연으로부터 멀리 떨어뜨려 왔다. 이제 우리는 기술과 문명과 더 가깝다. 그렇기에 자연에 돌아가기로, 동물적인 생활을 하기로 선택했을 때 사회적 표준의 시선으로 보았을 때 그들은 정신병자로 보이는 게 아닐까?
예술을 하는 사람들은 어떤 것일까? 그들의 영감, 그들의 예술세계. 그것들은 어디서 비롯된 것일까? 그것도 사회에서 비롯된 것일까? 아니면 정신적 영감은 자연에서 오는 것일까? 몽고반점에 매료되고, 나체의 몸에 꽃을 그리고 페인팅하고, 그러한 행위예술을 설계하는 그러한 발상은 어디에서 오는 것일까?
아. 어쩌면 아. 이것이 분출이구나. 외부의 자극과 괴로움을 분출해 내는 방식이구나. 압박, 강요, 사회의 요구, 에 맞춰서 자신을 몰아 붙이고 항상 노력하고 무엇인가 해내야만 하고. 그러한 사회적 압박감 속에서 .
1. 어떤 사람들은 순응한다. 힘들지만 꾸역 꾸역 그 기준을 맞춰 나가면서 살아간다. 가끔 찾아가는 맛집, 유튜브 이런 생각을 멈추는 수단들로 유흥을 즐긴다. 생각을 접는다.
2. 어떤 사람들은 잘 적응한다. 사회를 리드한다. 기술사회, 경쟁 사회의 승자들이다. 열심히 살면서 뿌듯함을 느끼고 자기계발도 하고 인간으로써 열심히 사회활동을 하면서 자신감 있게 살아간다.
3. 어떤 사람들은 좌절한다. 포기한다. 정신적 이상자가 된다.
4. 어떤 사람들은 예술 활동을 한다. 노래를 부르고 연기를 하고 글을 쓴다. 하지만 이것이 직업으로 연결된다면 진정한 의미에서의 분출이라고는 볼 수는 없지만 어쨌든 그들은 예술의 방법을 선택한다.
이 정도일까? 더 분류할 수 있을까? 이 목록에 포함되지 않은 사람들이 있을까?