YES24 3

[도서 입력 프로그램] 3-1. Selenium 입력 구조 구상

[도서 정보 자동 입력 프로그램] 3-1. Selenium 입력 구조 구상 이번 포스팅부터 본격적으로 Yes24로 도서 정보 입력을 시작한다.제일 처음으로 입력하는 구조를 구상해야 한다. 도서 정보를 알라딘에서 Yes24로 입력하는 것을 처음에는 그저 있는대로 복붙하는 굉장히 단순한 과정이라 생각했다.하지만 계속 진행을 하다보니 생각만큼 간단하지가 않았다.책의 종류가 많은 만큼 이런저런 예외적인 경우가 발생하고, 알라딘과 Yes24의 입력 방식과 분류가 달라서 그걸 끼워맞춰야할 일도 많았다. 대략적으로 아래와 같은 구분이 필요하다. 1) 가장 기본적이고 큰 문제는 바로 ISBN 유무이다.ISBN이 있는 도서라면 검색을 통해 기본정보를 불러와서 입력 절차를 간소화할 수 있다.ISBN이 없다면 모든 정보를 ..

[도서 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집

[도서 정보 자동 입력 프로그램] 2. BeautifulSoup 알라딘 도서 정보 수집이제 알라딘에서 필요한 도서정보를 수집 해보자.Yes24 등록을 위해 수집해야하는 정보는 아래와 같다.도서정보판매가격상품 상태(상/중/하)도서 구분(국내도서/외국도서/음반/DVD)도서 대표이미지(이미지 주소로 추출)도서 주제분류(중분류/소분류)저자명출판사명출판일자ISBN (없는 도서도 있음)책 주의사항(html 태그로 수집)책 사진(이미지 주소로 수집)이렇게 12가지이다. 이외에 서점별로 책 분류 및 색인을 위해 표기하는 자체 상품코드도 있는데 알라딘 판매자 로그인 자동화가 불가하므로 그것은 다른 방법을 통해 입력하도록 하겠다. 도서 페이지에서 이제 정보를 추출하기 위해서 파이썬 BeautifulSoup4 과 reque..

[도서 입력 프로그램] 0. Intro - 파이썬 독학 시작

[도서 입력 프로그램] 0. Intro - 파이썬 독학 시작결국 공부는 필요에 의할때 가장 원동력이 강력한것 같다. 거진 3~4년을 코딩을 배워볼까 생각만하다가 파이썬을 통한 업무자동화와 데이터분석의 매력을 느껴 시작한 파이썬 독학. 가장 큰 이유는 중고서점을 운영하시는 아버지께서 도서 정보를 입력하는 반복적인 일에 낭비되는 시간을 줄여보고자 하는 것이었다. 아버지는 매일 10~20권씩 수집하신 중고 도서정보의 책이름, 저자, 출판사, 책상태와 같은 도서정보를 먼저 알라딘에 입력하고 동일한 내용을 다시 Yes24에 등록하신다. 입력할때 대략 아래와 같은 문제들이 있다.ISBN이 등록된 서적의 경우 기존 알라딘이나 Yes24에 등록된 DB를 조회하여 기본 책정보를 불러온 뒤 책 상태나 가격정도만 입력하면 ..