이렇게 코딩해서 저렇게 까지 띄우게 만들긴 했는디 저기서 저는 제목만 뽑아내고 싶은데 어케하는질 모르겟어요..
그리고 하나더 도움 주실 수 있다면 2019-07-19저게 작성날인데 최신것만 뽑아내고 싶은데.. 코딩을 어케해야할까요..? class에 있는 것도 아니고 태그가 다 td인 것 같아서.. html도 몰라서 막 검생하면서 연구중이라 완전 초짜입니다..
도와주세요!
15개의 댓글
무분별한 사용은 차단될 수 있습니다.
월화수목금토일
경기도팥죽
그렇게 말하면 잘모라용... 좀만 더.. more..
경기도팥죽
저는 한글만 뽑아내고 싶은데... 어케하는 줄 모르게소우..
햇반충
우리학교 저거로 수강신청 프로그램 만들어서 1학기 성공했는데 2학기때는 성공하고 좀있다가 다 수강취소되더라
조심해 다 걸린다
Tbps
html 패킷에 헤더 쑤셔박아도 걸림?
햇반충
서버에서 그게 구분이 안되겠냐 ㅋㅋ
개드립 로그인해서 글긁어오는 프로그램만들어도 비정상접근 바로잡힘
Tbps
씨게 막을라면 막을순 있나 보네
멜론은 유저에이전트만 넣어줘도 크롤링 잘되던데
햇반충
나도 세션이런거 다루는거 연습할때 개드립이용해보려고 했는데 칼차단먹더라
경기도팥죽
그래서 위에 거는 어떻게 하는거죠 ㅠㅠㅠ
햇반충
a href="#popup_menu_area" class="ed link-reset member_31060066" onclick="return false"><img src="https://www.dogdrip.net/modules/point/icons/ddcoa/3.gif" alt="[레벨:3]" title="포인트:738드립력 (84%), 레벨:3/50" class="xe_point_level_icon" style="vertical-align:middle;margin:0px 3px 2px 0px;">경기도팥죽</a
f12해서 눌러보면 값 다뜬다
위의 값은 형 아이디에대한 리다이렉션 값인듯?
이거저거 지지고 볶고 하다보면 나옴
경기도팥죽
ㅋㅋㅋㅋㅋㅋㅋ 잘 만들어 보겠습니다
정보처리마법사
파이썬 문법을 모르니 그건 알아서 하고
td를 다 가져왔으면, td안에 a를 가져와서 a태그안의 텍스트를 가져오는게 가능할꺼임..
최신꺼는 노가다로 코딩하는 방법을 생각해보면
각 tr에 있는 td들 값만 뽑아서 저장할 수 있는 객체를 만들고,
모든 tr들의 있는값을 객체 리스트로 만드는걸 만들고,
객체 리스트에서 날짜로 정렬시킨 후,
제일 상단 index에 위치한 객체의 값을 뽑아 쓰면됨~
이거시 바로 입코딩이다 구현해라 노예야
츄바키
탐색한 태그에서 text만 가져오려면
.get_text()를 쓰시면 됩니다.
예제 코드는 다음과 같습니다.
strSubjectName = bsObj.find('p',{'class','subject-list'}).get_text()
.get_text()는 하나의 원소에만 작동하구요
findAll과 같이 쓸때는 findAll로탐색한 태그가 복수일 경우 반환값이 리스트이기 때문에 for문과 함께 쓰셔야 합니다.
(6개월전 공부한거라 가물 가물합니다~)
최신 것 만 뽑으려면 beautifulsoup와 정규식을 같이써서
2019-07-19 태그를 찾으신 다음에 형제 탐색을 통하여 원하는 정보를 가져오면 됩니다.
7월 탐색
bsObj.find('td', text=re.compile('2019-07-\d\d'))
7월 04일부터 09일 탐색
bsObj.find('td', text=re.compile('2019-07-0[4-9]'))
**점프투 파이썬 정규식 - https://wikidocs.net/1669
** 같은 태그에 쌓여있는, 즉 같은 레벨에 위치하는 태그들은 '형제들'(sibling)라고 하는데
이는 BeautifulSoup의 next_sibling과 previous_sibling으로 탐색이 가능합니다.
자세한 내용은 다른분의 블로그 글을 링크로 남기겠습니다.
https://pyther.tistory.com/13
너는나는너는나는너
경기도팥죽
Oooops..