파이썬 31

Python (19) - 구글 이미지를 크롤링 하는 방법 (Selenium)

HTML을 뽑아 이용하여 크롤링도 할 수 있지만 때로는 직접 브라우저를 사용할 때가 있습니다. 이번에는 직접 브라우저를 활용하여 구글 이미지들을 크롤링하는 방법을 알아보겠습니다. Selenium 먼저 크롤링은 웹상에서 수집된 정보를 수집해 오는 작업입니다. 그리고 Selenium은 프로그램을 이용하여 웹 자동화 및 테스트를 제공하는 프레임워크입니다. Selenium은 크롤링의 역할을 폭넓게 수행할 수 있습니다. 기존에 크롤러는 HTML 분석에 그쳤다면 직접 조작할 수 있습니다. 직접 조작할 수 있는 장점은 다음과 같습니다. 자바스크립트가 동적으로 만든 데이터를 크롤링할 수 있다. HTML의 다양한 요소(input, button 태그 등)의 클릭 및 입력이 필요할 수 있다. 여담으로 Selenium은 다양..

컴퓨터/Python 2023.08.09

Python (18) - 공공데이터 API를 이용하여 기상청 날씨를 가져오자

예전에 디시인사이드 크롤러를 만든적이 있었습니다. 크롤러를 이용하여 웹사이트의 소스코드를 복사하고 해당 데이터를 가공하여 사용할수 있었습니다. 크롤링과 다르게 가공된 정보를 가져올수 있는 API가 있습니다. 정부에서 운영하는 공공데이터 API가 있는데 제공 데이터를 바탕으로 날씨를 알아보겠습니다. 공공데이터 공공데이터는 정부와 공공기관이 생산하거나 수집한 데이터입니다. 해당 데이터를 이용하여 공공기관이 업무를 하며 이를 통하여 시민들에게 서비스를 제공합니다. 예를 들어 교육, 사회복지, 문화관광, 교통 정보, 기상 등 다양한 정보를 가지고 있습니다. 이러한 데이터는 누구나 무료로 접근하고 사용할 수 있습니다. 각 기관에 투명성을 높여주어, 시민들에게 다양한 혜택을 줍니다. 개인이나 기업에서 이를 활용하여..

컴퓨터/Python 2023.06.15

Python (17) - ChatGPT를 API로 사용해보자 (openai)

ChatGPT는 이미 아주 유명하다고 생각합니다. 인공지능 비서 등 다양한 요소에서 충분하게 사용할 수 있습니다. 해당 프로젝트 제작에 앞서, 파이썬으로 ChatGPT의 기본 엔진이 되는 GPT를 API로 사용하는 방법에 대하여 알아보겠습니다. GPT란 무엇인가? (해당 문구는 ChatGPT에 질문 한 것을 그대로 적었습니다.) GPT는 "Generative Pre-trained Transformer"의 약자로, 대규모 텍스트 데이터를 사용하여 사전에 훈련된 언어 모델입니다. 이 모델은 주로 자연어 이해(NLU) 분야에서 사용되며, 문장 생성, 기계 번역, 질의 응답, 문서 요약 등 다양한 자연어 처리 작업에 사용됩니다. GPT 모델은 인간과 같은 방식으로 문장을 생성하며, 이전에 입력된 문장의 문맥을 ..

컴퓨터/Python 2023.05.15

Python (16) - TTS와 STT를 구현하자 (pyttsx3, Speech Recogition)

군대에서 기가지니라는 인공지능 스피커를 처음 사용하였습니다. 최근에 인공지능 스피커에 대하여 관심을 가지기 시작하였는데 여기에서 핵심기술이 텍스트와 음성 간의 관계라고 생각합니다. 두 관계를 해결해야지 사람과 기계가 소통할 수 있기 때문입니다. 그래서 이번에는 사람과 기계가 소통하는 방법 TTS와 STT에 대하여 알아보겠습니다. STT (Speech to Text) "기가지니?"라고 우리가 말하면 기가지니는 "네?"라고 반응합니다. 어떻게 기가지니라고 말하는 것을 컴퓨터가 알아들었을까요? 이것은 STT라는 기술을 이용하여 음성을 분석하여 텍스트로 바꾸어 주기 때문입니다. 발음마다 매질이 달라 일일이 분석하여 해당 소리를 낼 수도 있지만 해당 과정은 몹시 어렵습니다. 그래서 파이썬에 패키지를 이용하려고 합..

컴퓨터/Python 2023.05.10

Python (15) - 파이썬 가상환경을 만들자 (venv)

한 프로그래밍 언어로 여러 가지 작업을 하다 보면 패키지의 충돌 등 다양한 문제가 생길 수 있습니다. 특히 파이썬 같은 경우에는 A라는 프로젝트를 돌리기에 패키지가 많은 오류를 일으킵니다. 이런 방법을 해결하기 위한 한 가지의 수단으로 가상환경을 이용해보도록 하겠습니다. 가상환경이 필요한 이유 위에서 말한 것과 같이 여러 가지 작업을 하다 보면 패키지의 충돌이 일어날 수 있습니다. 프로젝트마다 필요한 라이브러리나 패키지의 버전이 다르기 때문에 해당 사건이 일어날 수 있습니다. 이것을 의존성 분리라고 합니다. 가상환경을 통하여 의존성 충돌을 피하고, 각 프로젝트를 독립적으로 관리할 수 있습니다. 이를 통하여 효율적으로 프로젝트를 관리할 수 있으며 이는 프로그램 제작 후 배포 시에 용이합니다. 위의 두 사진..

컴퓨터/Python 2023.04.15

Python (14) - Tic-Tac-Toe게임을 만들어보자 (pygame)

파이썬에는 pygame이라는 멀티미디어 표현을 위한 라이브러리가 있습니다. 해당 라이브러리를 통해 다양한 게임들을 제작할 수 있습니다. 해당 라이브러리 소개를 위한 첫 프로젝트로 간단하게 제작이 가능한 틱택토를 구현해보았습니다. 완성된 소스 코드가 필요하신 분은 아래 링크 클릭하여 소스 코드로 바로 이동하면 됩니다. 소스 코드 Tic-Tac-Toe (틱택토) 틱택토는 서양 놀이 중 하나로 3x3 보드에서 가로, 세로, 대각선 중 한 줄을 만들면 승리하는 게임입니다. 간단하게 삼목입니다. 플레이 방법은 다음과 같습니다. 가로 두 줄 세로 두 줄을 그립니다. 1P와 2P는 3x3 공간 안에 각각 O, X를 번갈아 가면서 그립니다. 가로, 세로, 대각선 중 한 줄이 완성되는 경우 만든 사람이 승리합니다. 게임..

컴퓨터/Python 2023.02.14

Python (13) - 파이썬으로 QR코드를 만들어보자 (qrcode)

QR코드는 정보를 오프라인으로 담을 수 있는 한 가지 방법입니다. 해당 방법을 이용하여 더 쉽고 빠르게 정보를 공유할 수 있습니다. 파이썬에서도 QR코드를 생성할 수 있는 모듈이 있는데 이번에는 해당 모듈에 대해 알아보겠습니다. QR코드는 무엇인가? QR코드는 Quick Responce의 약자로 1994년 일본 'Denso Wave'에서 개발되었습니다. 2차원으로 데이터를 나열한 정보표시 방법으로 흰색 바탕에 검정색 점으로 구성되어 있습니다. 해당 기술을 응용하여 URL, 텍스트 등 데이터를 담거나, 회용으로 제공하는 링크를 이용하여 결제기능을 구현할 수 있습니다. QR코드는 QR코드 리더 및 스캐너를 통해 읽을 수 있습니다. QR코드의 특징 어떤 방향에서 측정해도 인식할 수 있다. 문자 기준 4096자..

컴퓨터/Python 2023.02.09

프로젝트 - 자동차 장애물 신속 대처 시스템 제작 후기

2022년 3월부터 12월까지 학교에서 4학년을 맞이하여 캡스톤디자인이라는 다소 생소한 과목 이름과 함께 졸업 연구를 하였습니다. 작품 제작부터 학술제까지 그동안의 과정에서 못했던 이야기를 한번 풀어보려고 합니다.※ 서버 파트 제작자의 시선으로 해당 연구에 대하여 진행하였음을 이야기합니다. 자동차 장애물 신속 대처 시스템 우리가 일상생활에 필요한 것이 무엇이 있을까 생각하였습니다. 조원들과 생각하던 중 "자동차에 AI를 사용할 수 있을까?"라는 개념으로 출발하게 되었으며 이는 장애물로 인한 사고 위치 및 상황을 자동으로 탐지한다는 결과에 이르렀습니다. 현재는 운전자가 신고하려면 ‘한국도로공사’에서 제공하는 앱이나 전화로 많은 단계를 거처 신고를 해야 한다는 불편함으로 신고율이 낮아질 수 있다고 판단하였습..

Python (12) - 재귀함수를 이용하여 팩토리얼, 하노이탑을 풀어보자

재귀함수를 이용하여 알고리즘을 구성하는 경우 많은 문제를 해결할 수 있습니다. 재귀함수와 어떻게 사용해야 하는지 팁을 공유하도록 하겠습니다. 재귀함수 어떠한 함수에서 자신을 다시 호출하여 작업하는 작업방식입니다. 위의 이미지는 방송을 호출할 때 무한화면으로 나와 있는데 이것처럼 이론상 무한으로 재귀함수를 사용할 수 있습니다. 하지만 재귀함수의 공간을 스택 메모리에 담기 때문에 너무 많은 재귀함수를 사용하는 경우 스택 오버플로우로 에러가 날 수 있습니다. 여담으로 재귀함수를 사용하지 않아도 반복문으로 재귀함수처럼 문제를 해결할 수 있습니다. 그럼에도 불과하고 재귀함수를 사용하는 경우는 다음과 같습니다. 재귀적인 경우가 더 자연스러운 알고리즘인 경우에 사용한다 스택으로 메모리를 이용하기 때문에 변수 사용이 ..

컴퓨터/Python 2023.01.14

Python (11) - 스택(Stack)과 큐(Queue) 구현하기

우리가 자료구조를 공부함으로 복잡한 프로그램들을 편하게 설계할 수 있습니다. 기본적인 자료구조들을 넘어 중요한 두 가지 자료구조를 소개합니다. 바로 스택과 큐입니다. 시작하기 전에 개념 단어 자료구조에서 쓰는 단어 중 FIFO, FILO, LIFO, LILO이라는 단어가 있습니다. FIFO (First In First Out) : 먼저 데이터가 먼저 빠져나가는 구조 (큐) FILO (First In Last Out) : 먼저 데이터가 가장 마지막에 빠져나가는 구조 (스택) LIFO (Last In First Out) : 마지막 데이터가 가장 먼저 빠져나가는 구조 (스택) LILO (Last In Last Out) : 마지막 데이터가 마지막 나오는 구조 (큐) 스택 (Stack) 스택은 LIFO의 개념을 ..

컴퓨터/Python 2023.01.09