본문 바로가기
반응형

업무자동화8

[도서 입력 프로그램] 3-2. Selenium XPATH 찾기 [도서 정보 자동 입력 프로그램] 3-2. Selenium XPATH 찾기 지난 포스트로 추출한 도서 정보를 이제 본격적으로 Yes24에 등록할 시간이다.Yes24 판매관리 페이지에서 도서 정보를 등록하기 위해서는 여러가지 기본 버튼, 라디오버튼, 드롭다운 메뉴, 파일업로드(이미지 업로드)창을 클릭해야 한다.  Selenium으로 웹페이지에서 해당하는 버튼 등을 제어하려면 정확한 XPATH주소가 필요하다.잘 모를때는 크롬 개발자모드에서 XPATH주소를 그대로 복사해서 넣었는데 그러다 보니 제대로 Click이 안되는 경우가 빈번했다. 그리하여 id 등 특정 속성으로 태그를 특징하여 XPATH 주소를 넣어보니 제어가 잘 되었다. 그런데, id를 기준으로 XPATH를 작성한뒤 코드를 계속 작성하면서 테스트를 .. 2024. 5. 9.
[도서 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집 [도서 정보 자동 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집이제 알라딘에서 필요한 도서정보를 수집 해보자.Yes24 등록을 위해 수집해야하는 정보는 아래와 같다.도서정보판매가격상품 상태(상/중/하)도서 구분(국내도서/외국도서/음반/DVD)도서 대표이미지(이미지 주소로 추출)도서 주제분류(중분류/소분류)저자명출판사명출판일자ISBN (없는 도서도 있음)책 주의사항(html 태그로 수집)책 사진(이미지 주소로 수집)이렇게 12가지이다. 이외에 서점별로 책 분류 및 색인을 위해 표기하는 자체 상품코드도 있는데 알라딘 판매자 로그인 자동화가 불가하므로 그것은 다른 방법을 통해 입력하도록 하겠다. 도서 페이지에서 이제 정보를 추출하기 위해서 파이썬 BeautifulSoup4 과 reque.. 2024. 5. 3.
[도서 입력 프로그램] 1. Selenium 자동 로그인 (feat. 소스코드 민감정보 보안) [도서 정보 자동 입력 프로그램] 1. Seleinium 자동 로그인자동화가 필요한 대략적인 작업 구조는 이러하다.1. 알라딘 판매자 로그인2. Yes24로 입력할 도서 정보(ISBN, 도서명, 가격, 상태 등) 추출3. Yes24 판매자 로그인4. 도서 정보 입력 후 등록 우선 1번과 3번에서 필요한 자동 로그인 기능부터 구현해보자.파이썬으로 웹페이지 자동 로그인을 하기 위해서는 주로 Selenium 라이브러리를 사용한다. 나 같은 초짜일 수록 코딩의 9할은 결국 복붙인것 같다.Chat GPT가 활성화된 요즘엔 특히 더욱 그러하다.구글링 또는 Chat GPT로 쉽게 Selenium 자동 로그인 코드를 검색해서 아래와 같이 적용해보았다.from selenium import webdriverfrom sel.. 2024. 4. 30.
[도서 입력 프로그램] 0. Intro - 파이썬 독학 시작 [도서 입력 프로그램] 0. Intro - 파이썬 독학 시작결국 공부는 필요에 의할때 가장 원동력이 강력한것 같다. 거진 3~4년을 코딩을 배워볼까 생각만하다가 파이썬을 통한 업무자동화와 데이터분석의 매력을 느껴 시작한 파이썬 독학. 가장 큰 이유는 중고서점을 운영하시는 아버지께서 도서 정보를 입력하는 반복적인 일에 낭비되는 시간을 줄여보고자 하는 것이었다. 아버지는 매일 10~20권씩 수집하신 중고 도서정보의 책이름, 저자, 출판사, 책상태와 같은 도서정보를 먼저 알라딘에 입력하고 동일한 내용을 다시 Yes24에 등록하신다. 입력할때 대략 아래와 같은 문제들이 있다.ISBN이 등록된 서적의 경우 기존 알라딘이나 Yes24에 등록된 DB를 조회하여 기본 책정보를 불러온 뒤 책 상태나 가격정도만 입력하면 .. 2024. 4. 29.
반응형