프로그래밍

크롤링 코딩하고 있는데 도움좀 주세요..

1.PNG

 

이렇게 코딩해서 저렇게 까지 띄우게 만들긴 했는디 저기서 저는 제목만 뽑아내고 싶은데 어케하는질 모르겟어요..

 

 

2.PNG

 

그리고 하나더 도움 주실 수 있다면 2019-07-19저게 작성날인데 최신것만 뽑아내고 싶은데.. 코딩을 어케해야할까요..? class에 있는 것도 아니고 태그가 다 td인 것 같아서.. html도 몰라서 막 검생하면서 연구중이라 완전 초짜입니다..

 

도와주세요!

 

15개의 댓글

[삭제 되었습니다]
2019.07.20
@월화수목금토일

그렇게 말하면 잘모라용... 좀만 더.. more..

0
2019.07.20
@월화수목금토일

저는 한글만 뽑아내고 싶은데... 어케하는 줄 모르게소우..

0
2019.07.20

우리학교 저거로 수강신청 프로그램 만들어서 1학기 성공했는데 2학기때는 성공하고 좀있다가 다 수강취소되더라

조심해 다 걸린다

0
2019.07.20
@햇반충

html 패킷에 헤더 쑤셔박아도 걸림?

0
2019.07.20
@Tbps

서버에서 그게 구분이 안되겠냐 ㅋㅋ

개드립 로그인해서 글긁어오는 프로그램만들어도 비정상접근 바로잡힘

0
2019.07.20
@햇반충

씨게 막을라면 막을순 있나 보네

 

멜론은 유저에이전트만 넣어줘도 크롤링 잘되던데

0
2019.07.20
@Tbps

나도 세션이런거 다루는거 연습할때 개드립이용해보려고 했는데 칼차단먹더라

0
2019.07.20
@햇반충

그래서 위에 거는 어떻게 하는거죠 ㅠㅠㅠ

0
2019.07.20

a href="#popup_menu_area" class="ed link-reset member_31060066" onclick="return false"><img src="https://www.dogdrip.net/modules/point/icons/ddcoa/3.gif" alt="[레벨:3]" title="포인트:738드립력 (84%), 레벨:3/50" class="xe_point_level_icon" style="vertical-align:middle;margin:0px 3px 2px 0px;">경기도팥죽</a

f12해서 눌러보면 값 다뜬다

위의 값은 형 아이디에대한 리다이렉션 값인듯?

이거저거 지지고 볶고 하다보면 나옴

0
2019.07.20
@햇반충

ㅋㅋㅋㅋㅋㅋㅋ 잘 만들어 보겠습니다

0

파이썬 문법을 모르니 그건 알아서 하고

td를 다 가져왔으면, td안에 a를 가져와서 a태그안의 텍스트를 가져오는게 가능할꺼임..

 

최신꺼는 노가다로 코딩하는 방법을 생각해보면

각 tr에 있는 td들 값만 뽑아서 저장할 수 있는 객체를 만들고,

모든 tr들의 있는값을 객체 리스트로 만드는걸 만들고,

객체 리스트에서 날짜로 정렬시킨 후,

제일 상단 index에 위치한 객체의 값을 뽑아 쓰면됨~

 

이거시 바로 입코딩이다 구현해라 노예야

1
2019.07.20

탐색한 태그에서 text만 가져오려면

.get_text()를 쓰시면 됩니다.

 

예제 코드는 다음과 같습니다.

strSubjectName = bsObj.find('p',{'class','subject-list'}).get_text()

.get_text()는 하나의 원소에만 작동하구요

findAll과 같이 쓸때는 findAll로탐색한 태그가 복수일 경우 반환값이 리스트이기 때문에 for문과 함께 쓰셔야 합니다.

(6개월전 공부한거라 가물 가물합니다~)

 

최신 것 만 뽑으려면 beautifulsoup와 정규식을 같이써서

2019-07-19 태그를 찾으신 다음에 형제 탐색을 통하여 원하는 정보를 가져오면 됩니다.

 

7월 탐색

bsObj.find('td', text=re.compile('2019-07-\d\d'))

 

7월 04일부터 09일 탐색

bsObj.find('td', text=re.compile('2019-07-0[4-9]'))

 

**점프투 파이썬 정규식 - https://wikidocs.net/1669

 

** 같은 태그에 쌓여있는, 즉 같은 레벨에 위치하는 태그들은 '형제들'(sibling)라고 하는데

이는 BeautifulSoup의 next_sibling과 previous_sibling으로 탐색이 가능합니다.

자세한 내용은 다른분의 블로그 글을 링크로 남기겠습니다.

https://pyther.tistory.com/13

 

 

1
[삭제 되었습니다]
2019.07.22
@너는나는너는나는너

Oooops..

0
무분별한 사용은 차단될 수 있습니다.
번호 제목 글쓴이 추천 수 날짜 조회 수
180361 [컴퓨터] p41을 서브 게임저장용은 낭비인가? 4 신우철 0 37 분 전 34
180360 [정보] 해당 모니터암이 여기 모니터2개에 맞을지 모르겠습니다 2 골든베릴 0 3 시간 전 67
180359 [견적] (직구) SK하이닉스 Platinum P41 2TB PCIe4.0 NVMe M.2 2280 ... 6 요기쪄 0 3 시간 전 173
180358 [컴퓨터] 이거 괜찮은 가격인가요? 5 죽업 0 4 시간 전 122
180357 [잡담] 급해서 특급운송으로 주문했는데... 오브 0 4 시간 전 91
180356 [컴퓨터] 사도 됨? 8 or5469 0 7 시간 전 131
180355 [모바일] 에어팟 프로 1세대 노이즈 캔슬링시 들리는 잡음 해결 방법 5 기승전치킨 0 9 시간 전 126
180354 [컴퓨터] RX7600 생각보다 잘만들었네? 7 Vv연옥의사신vV 0 10 시간 전 212
180353 [컴퓨터] 모니터가 FHD이면.. FHD이상은 차이없는거 아닌가? 4 ing 0 10 시간 전 161
180352 [견적] 컴 살까 하는데 견적 어떤가여 5 함박눈 0 12 시간 전 85
180351 [컴퓨터] 5700x3d 장착 후기 1 바숲 1 12 시간 전 147
180350 [잡담] U4025QW 도착! (WFHD 75 HZ -> WUHD 120HZ 한방 업글기) 3 냐하하하하 1 13 시간 전 103
180349 [견적] 노트북 처음 사보려고 하는데 어디서 어떻게 사야 좋을까요? 5 하늘을나는잉어킹 0 13 시간 전 63
180348 [컴퓨터] 요즘 윈도우 하는짓거리 너무싫어서 5 Vv연옥의사신vV 0 13 시간 전 186
180347 [모바일] 핏3 구매후 느낀점 4 타이거밤 0 14 시간 전 182
180346 [컴퓨터] 암드9천번대 및 5080존버 견적좀 봐주세여 16 사촌간부랄빨기 0 14 시간 전 116
180345 [프로그래밍] Exiftool 이거 일본어 못 읽는데 12 부터시작하는이세... 0 15 시간 전 146
180344 [잡담] 컴터 질렀다 32 사촌간부랄빨기 0 16 시간 전 171
180343 [컴퓨터] 모니터 화면 10 흙수저 0 16 시간 전 82
180342 [컴퓨터] SSD 문제 있을때 고칠 방법 뭐가 있을까? 4 베데엔차 0 16 시간 전 97