본문 바로가기

데이터분석(Data analysis)7

데이터 분석가의 미래에 대한 고찰 안녕하세요. 오늘은 12년 차 데이터 분석가로서 느끼는 현재 데이터 분석가의 위치와 향후 방향에 대해 말해볼까 합니다. 1. 과거 데이터 분석가2010년 이전에는 데이터에 대한 신뢰가 크지 않아 여유 있는 일부 대기업에서만 통계분석가를 고용하여 참고자료를 만드는 목적으로 분석을 진행했었습니다. 당시 데이터가 부족하기도 했고 데이터 분석을 위해 비용을 들이는 것보다 현업 종사자의 감각에 의한 의사결정이 더 효율적이었기 때문에 데이터 중심 의사결정을 하는 회사가 거의 없었으며 데이터를 활용한다 하더라도 매출, 영업이익, 판매량과 같은 MIS 자료를 만드는 수준에 불과하였습니다. 또한 통계 분석가가 있는 기업도 분석가 역량에 따라 편차가 심해 자료를 신뢰하기 어려웠고 자료를 보는 사람들도 통계에 대한 지식을 .. 2025. 2. 24.
torch.tensor와 torch.Tensor 차이점 - Pytorch 함수 특징 안녕하세요. 오늘은 Python 대표 딥러닝 프레임 워크인 Pytorch 함수 특징에 대해 알아보려고 합니다. Pytorch를 한번이라도 사용해 보셨다면 torch.tensor와 torch.Tensor 중 하나는 사용해 보셨을 텐데요. tensor와 Tensor 함수는 array나 list 형태인 데이터를 tensor화 하여 Pytorch에서 데이터를 처리하거나 학습할 때 호환이 될 수 있도록 도와주는 Pytorch 내장함수입니다. Pytorch를 사용하여 학습을 진행하고자 할때 tensor 또는 Tensor 함수를 사용하여 데이터를 변환해 준 뒤 연산처리를 하게 되는데요. 얼핏 보면 같은 기능을 하는 함수인데 왜 2개씩이나 만들어놨는지 한 번쯤 궁금하셨을 겁니다. 결론부터 말하자면 torch.Tenso.. 2024. 2. 5.
데이터 분석가가 알려주는 Pytorch Gradient 계산의 이해 안녕하세요. 오늘은 딥러닝 프레임워크인 Pytorch를 이용하여 Gradient를 산출하고 그 원리에 대해 알아보도록 하겠습니다. Gradient란 미분을 통해 얻어지는 기울기이며 학습을 할 때 사용됩니다. 딥러닝이나 머신러닝 프레임 워크를 사용하면 기울기 정도는 자동으로 계산해 주지만 사용자 입장에서는 반드시 이해하고 있어야 할 중요한 개념입니다. 따라서 Gradient를 완벽하게 이해하기 위해 임의의 식을 만들어 Pytorch를 이용해 기울기를 산출하고 직접 풀어 증명해 보도록 하겠습니다. [소스코드] import torch x = torch.tensor(1., dtype=torch.float, requires_grad=True) y = (x+5)**3 y.backward() x.grad [출력결과].. 2023. 10. 22.
인공지능으로 로또번호 예측이 가능할까? - 전문가가 말해준다! 안녕하세요 ㅎ 오늘은 인공지능으로 로또번호 예측이 가능한가에 대해 알아보도록 하겠습니다. 저는 현재 금융권 데이터 분석 팀에서 인공지능을 활용하여 데이터 분석을 하거나 예측 모델링을 담당하고 있습니다. 주변 사람들에게 회사에서 인공지능을 다룬다고하면 로또번호도 맞출 수 있는지 물어보시는 분들이 많습니다. 결론부터 말씀드리면 "이론상 가능하지만 현실적으로 불가능하다!"입니다. 인공지능은 말 그대로 지능을 인공적으로 만든 것 일 뿐입니다. 즉, 인공지능이란 사람이 판단하여 할 수 있는 부분을 컴퓨터 알고리즘을 활용하여 컴퓨터가 사람처럼 판단할 수 있도록 만든 것입니다. 따라서 사람이 못하는 것은 인공지능도 할 수 없습니다. "그럼 인공지능을 왜 사용할까?" 라고 의문을 갖는 독자분들도 있을 겁니다. 우리가 .. 2020. 10. 5.
어떤 그래프가 좋을까? - 데이터분석 안녕하세요!! 오늘은 데이터를 시각화할 때 가장 고민거리인 그래프 선택 방법에 대해 알아보려고 합니다. 그래프 종류는 매우 다양하기 때문에 해당 데이터를 잘 표현해주는 그래프를 선택해주어야 하는데요. 데이터마다 특성이 존재하므로 그에 맞는 그래프는 어떤 것이 있을지 확인해보도록 하겠습니다. 그래프 추천에 앞서 데이터 특성 확인을 위해 몇 가지 통계용어에 대해 알아보겠습니다. 데이터는 크게 범주형과 연속형이라는 변수로 나뉘어집니다. 범주형은 이산형 변수라고도 불리며, 어떠한 데이터를 한 그룹으로 묶어 범주화시킨 데이터를 말합니다. 대표적으로 성별, 지역, 연령대 등이 있습니다. 연속형은 수치 변화에 대해 의미를 담고 있는 데이터를 말합니다. 대표적으로 신용점수, 키, 몸무게 등이 있습니다. 이러한 범주형과.. 2020. 5. 2.
머신러닝 기초, 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)에 대해 알아보자! 안녕하세요 ㅎ 오늘은 머신러닝 기초, 지도 학습과 비지도 학습, 강화 학습에 대해 알아보고자 합니다. 머신러닝에 대해 잘 모르신다면 아래 링크를 참고해주시면 되겠습니다. AI? 머신러닝? - 인공지능이란 무엇인가. AI? 머신러닝? - 인공지능에 대해 알아보자! 안녕하세요. ㅎ 오늘은 4차 산업의 핵심이자 뜨겁게 달아오르고 있는 인공지능에 대해 알아보려고 합니다. 여러분들은 인공지능에 대해 어떻게 생각하고 계신가요? 요즘 무인 자동차, 로봇, 유튜브, 케이블티브이.. scikitlearn.tistory.com 지도학습과 비지도 학습, 강화 학습을 설명드리기 전에 먼저 학습부터 설명드리면 머신러닝에서 학습이란 어떤 문제를 풀기 위해 컴퓨터에게 데이터를 주입시키는 것을 말합니다. 즉, 컴퓨터에게 정보를 주입.. 2020. 3. 4.