프로그래밍

크롤링 코딩하고 있는데 도움좀 주세요..

1.PNG

 

이렇게 코딩해서 저렇게 까지 띄우게 만들긴 했는디 저기서 저는 제목만 뽑아내고 싶은데 어케하는질 모르겟어요..

 

 

2.PNG

 

그리고 하나더 도움 주실 수 있다면 2019-07-19저게 작성날인데 최신것만 뽑아내고 싶은데.. 코딩을 어케해야할까요..? class에 있는 것도 아니고 태그가 다 td인 것 같아서.. html도 몰라서 막 검생하면서 연구중이라 완전 초짜입니다..

 

도와주세요!

 

15개의 댓글

[삭제 되었습니다]
2019.07.20
@월화수목금토일

그렇게 말하면 잘모라용... 좀만 더.. more..

0
2019.07.20
@월화수목금토일

저는 한글만 뽑아내고 싶은데... 어케하는 줄 모르게소우..

0
2019.07.20

우리학교 저거로 수강신청 프로그램 만들어서 1학기 성공했는데 2학기때는 성공하고 좀있다가 다 수강취소되더라

조심해 다 걸린다

0
2019.07.20
@햇반충

html 패킷에 헤더 쑤셔박아도 걸림?

0
2019.07.20
@Tbps

서버에서 그게 구분이 안되겠냐 ㅋㅋ

개드립 로그인해서 글긁어오는 프로그램만들어도 비정상접근 바로잡힘

0
2019.07.20
@햇반충

씨게 막을라면 막을순 있나 보네

 

멜론은 유저에이전트만 넣어줘도 크롤링 잘되던데

0
2019.07.20
@Tbps

나도 세션이런거 다루는거 연습할때 개드립이용해보려고 했는데 칼차단먹더라

0
2019.07.20
@햇반충

그래서 위에 거는 어떻게 하는거죠 ㅠㅠㅠ

0
2019.07.20

a href="#popup_menu_area" class="ed link-reset member_31060066" onclick="return false"><img src="https://www.dogdrip.net/modules/point/icons/ddcoa/3.gif" alt="[레벨:3]" title="포인트:738드립력 (84%), 레벨:3/50" class="xe_point_level_icon" style="vertical-align:middle;margin:0px 3px 2px 0px;">경기도팥죽</a

f12해서 눌러보면 값 다뜬다

위의 값은 형 아이디에대한 리다이렉션 값인듯?

이거저거 지지고 볶고 하다보면 나옴

0
2019.07.20
@햇반충

ㅋㅋㅋㅋㅋㅋㅋ 잘 만들어 보겠습니다

0

파이썬 문법을 모르니 그건 알아서 하고

td를 다 가져왔으면, td안에 a를 가져와서 a태그안의 텍스트를 가져오는게 가능할꺼임..

 

최신꺼는 노가다로 코딩하는 방법을 생각해보면

각 tr에 있는 td들 값만 뽑아서 저장할 수 있는 객체를 만들고,

모든 tr들의 있는값을 객체 리스트로 만드는걸 만들고,

객체 리스트에서 날짜로 정렬시킨 후,

제일 상단 index에 위치한 객체의 값을 뽑아 쓰면됨~

 

이거시 바로 입코딩이다 구현해라 노예야

1
2019.07.20

탐색한 태그에서 text만 가져오려면

.get_text()를 쓰시면 됩니다.

 

예제 코드는 다음과 같습니다.

strSubjectName = bsObj.find('p',{'class','subject-list'}).get_text()

.get_text()는 하나의 원소에만 작동하구요

findAll과 같이 쓸때는 findAll로탐색한 태그가 복수일 경우 반환값이 리스트이기 때문에 for문과 함께 쓰셔야 합니다.

(6개월전 공부한거라 가물 가물합니다~)

 

최신 것 만 뽑으려면 beautifulsoup와 정규식을 같이써서

2019-07-19 태그를 찾으신 다음에 형제 탐색을 통하여 원하는 정보를 가져오면 됩니다.

 

7월 탐색

bsObj.find('td', text=re.compile('2019-07-\d\d'))

 

7월 04일부터 09일 탐색

bsObj.find('td', text=re.compile('2019-07-0[4-9]'))

 

**점프투 파이썬 정규식 - https://wikidocs.net/1669

 

** 같은 태그에 쌓여있는, 즉 같은 레벨에 위치하는 태그들은 '형제들'(sibling)라고 하는데

이는 BeautifulSoup의 next_sibling과 previous_sibling으로 탐색이 가능합니다.

자세한 내용은 다른분의 블로그 글을 링크로 남기겠습니다.

https://pyther.tistory.com/13

 

 

1
[삭제 되었습니다]
2019.07.22
@너는나는너는나는너

Oooops..

0
무분별한 사용은 차단될 수 있습니다.
번호 제목 글쓴이 추천 수 날짜 조회 수
5655 [프로그래밍] 어떻게 공부하면 될까 4 운빵 0 1 일 전 169
5654 [프로그래밍] 혹시 강의해본애들있어?? 8 억로또당첨자 0 2 일 전 336
5653 [프로그래밍] 옵시디언(노트앱) 사용 후기 10 너가전부옳아 1 3 일 전 236
5652 [프로그래밍] xcode15 년차html개발자 1 3 일 전 142
5651 [프로그래밍] 파이썬 초보인데 스트레스 오지게 받는데 7 부터시작하는이세... 2 4 일 전 420
5650 [프로그래밍] 이런건 무슨언어로 만든건지 짐작가? 16 커피2리터 0 4 일 전 448
5649 [프로그래밍] 패스트캠퍼스 할인 낚시 좀 심하네 3 조강현 0 6 일 전 223
5648 [프로그래밍] Claude 시발 chatgpt 복붙 후 프롬프트만 추가한거 아니냐?? ... 4 닉넴뭐할가 1 6 일 전 270
5647 [프로그래밍] 원격제어 프로그램 만드려는데 강의 추천 좀 9 집에가게해줘 0 7 일 전 228
5646 [프로그래밍] vnc 유료라도 좋으니 좋은거 추천점... 11 아마존새개들끼 0 8 일 전 261
5645 [프로그래밍] 공부 왜함? AI한테 잘 보이면 되는데 2 조강현 1 8 일 전 243
5644 [프로그래밍] 프로그래머 특) 웹서핑할때 사이트 도메인주소 직접침 13 삼각김밥맛있어 0 8 일 전 281
5643 [프로그래밍] RnD 수행계획서 같은거 써본 개붕이 있음? 3 69746974 0 9 일 전 286
5642 [프로그래밍] 형님들 JNI 질문 있어요 [해결] 2 dogdrippy 0 9 일 전 146
5641 [프로그래밍] 혹시 프로그래밍 강의해본사람 있음?? 7 억로또당첨자 0 10 일 전 401
5640 [프로그래밍] 자바 동시성 프로그래밍 공부 분량이 적지 않네 14 찰나생멸 0 10 일 전 316
5639 [프로그래밍] react jest 코드에서 에러가 날 상황 아시는 분? Hime 0 11 일 전 133
5638 [프로그래밍] 요번에 그림 넣으면 자동으로 UI생성해주는 거 질문한 개붕인데 1 케로로중사 0 11 일 전 207
5637 [프로그래밍] 맥쓸때마다 너무 스트레스 받는다 10 정소민 0 12 일 전 342
5636 [프로그래밍] 신입뽑을려고 질문리스트 만들어봄 22 69746974 0 12 일 전 421