본문 바로가기

Orange34

[Orange3] 머신러닝 사용하기 (Machine learning) Role - 분석, 예측 작업을 할때 각각의 열들이 어떤 역할을 하는가 지정해주는 기능 클릭해보면 4가지 형태가 있다. skip - 분석작업에서 아예 무시해도 되는 작업 meta - 실제 분석작업엔 활용되지는 않지만 정보성으로 남겨두면 좋은것들 target - 예측, 분석하고자 하는 것 (종속변수) feature - 원인 (독립변수) 온도와 판매량의 상관관계로 예시를 들어 실습을 진행해보았다. 온도가 18도일때 36개가 팔릴거라는것을 컴퓨터가 직접 알아냄. Linear regression을 통해 값을 도출받음. y=2x라는 간단한 모델이지만 만약 더욱 복잡하다면 수학자나 전문가도 평생을 바쳐 알아낼것을 손쉽게 알아낼수 있을것이다. 현실은 더욱 복잡한 독립변수들로 이루어져 있지만 간단한 모델 실습을 통해 .. 2022. 9. 3.
[Orange3] 산점도와 상관관계 (Scatter Plot) Scatter Plot을 알아보았다. orange3에 내장되어있는 기능 중 하나인데 데이터 값을 그래프와 표로 시각화해서 잘 나타내어준다. x축 y축 각각 어떤 요소를 나타낼것인지 설정도 가능하고 속성 color , shapem, size, label 모두 각각 설정 가능하다. 또한 show regression line을 체크하면 각 점들을 선으로 연결해주는 기능도 있다. 2022. 9. 3.
[Orange3] Box plot 알아보기 오늘은 Orange3의 box plot 기능에 대해 알아봤다. boxplot 을 이용하면 데이터의 평균값, 중앙값, 표준편차를 알 수 있다. 노란색선이 데이터의 가운데 값 가장 바깥쪽에 있는 값은 최솟값 가장 오른쪽에 있는 값은 최댓값 최솟값과 중앙값을 쪼개서 만든곳이 1분위 중앙값과 최댓값을 쪼개서 만든값이 3분위 중앙값이 2분위 파란선을 반으로 나누면 그 값이 표준편차가 된다. 시각화된 자료로 직관적으로 한번에 볼 수 있어서 유용하다. 2022. 9. 3.
[Orange3] 코드와 수학 없이 데이터과학, 통계, 머신러닝을 다룰 수 있는 도구 오렌지 알아보기 생활코딩님 유튜브에 제공되는 오픈데이터를 활용해서 실습에 참여해봤다. 아래는 활용데이터 링크이다. https://docs.google.com/spreadsheets/d/118Nln_zAaFKP8E2fxmqQmEWDmo1goLUzTQrIFS6or1Y/edit#gid=0 표를 자유자재로 다뤄보는 연습을 함. url을 통해 소스를 불러 올 수 있어서 정말 편하다. 시각화된 움직임으로 이해하기가 정말 편하고 누구나 사용가능한 느낌이다. 오렌지를 통해 얼른 머신러닝을 해보고 싶다. 어떤식으로 사용될지? 궁금하다. 오늘은 이만 늦었으니 내일 더 알아보기로 함 2022. 9. 2.