게시판 본문 ASP, ASP.NET, IIS & Script - Read Only
질문드립니다. |
---|
작성자: 구나구나
작성일시: 2006-06-24 01:18,
조회수: 3,445
|
안녕하세요.. 또 질문 드리게 되었네요.
제가하고 싶은 일은, HTML 페이지에서 원하는 정보를 빼낸후 DB 에 넣으려고 합니다. 구체적으로 말해서, 법제처사이트 에서 제공하고 있는 법령을 모두 긁어 오려고 합니다. IHTMLDocument2 를 이용하면 충분히 가능하리라고 생각됩니다. 원하는 테그들을 뽑아 올수 있으니까요.. 그리고 이미 1000 개의 페이지 소스(HTML)는 긁어온 상태입니다. (TEXT 파일로 존재) 긁어오는것은 WebRequest 객체를 사용해서 가볍게 가져올수 있었습니다. 그런데, 두가지 문제가 있었습니다. 첫번째, XmlTextReader 와 XmlDocument 를 사용해서 작업을 하려고 하니까, 긁어온 HTML 은 완벽한 XML 형태가 아니라서 XmlDocument 로 Load() 할수 없더군요. 브라우져에 띄워져있는 HTML 은 메모리 상에서 완벽한 XML 형태를 가지지만, XmlTextReader 를 사용해서 불러온 Xml 은 완벽한 포멧을 가진 HTML 을 사용해야만 가능 한것 같습니다. 참고 : XmlTextReader xtr = new XmlTextReader("test.htm"); XmlDocument objDoc = new XmlDocument(); objDoc.Load(xtr); MessageBox.Show(objDoc.InnerText); // Root 가 여러개 있음.. 에러 두번째, 브라우져에 페이지를 로딩하면 IHTMLDocument2 를 얻을 수 있겠죠. 하지만, 작업해야 할 페이지가 워낙 많기 때문에 부담감이 있습니다. 작업도 번거러울것 같구요.. (wbMain_DocumentComplete 이벤트에다가 작업을 해야 하는등의...) 그래서 제가 원하는것은,, 로컬에 있는 HTML 파일을 브라우져에 로딩하지 않고, IHTMLDocument2 를 만드는 방법이 없을까요? (즉, XmlDocument 로 로딩할수 없을까요?) 또 다시 한번 부탁드립니다. |
IP 주소: 60.196.70.21
|
전체 2,095 건의 게시물,
84 페이지로 구성된
ASP, ASP.NET, IIS & Script 게시판의
25 페이지입니다.
게시물 | ||||
---|---|---|---|---|
1,536 | 2006-07-11 | 5,963 | ||
1,535 | 2006-07-11 | 3,375 | ||
1,534 | 2006-07-07 | 3,209 | ||
1,533 | 2006-07-09 | 3,299 | ||
1,532 |
최형석 |
2006-07-09 | 1,301 | |
1,531 | 2006-07-06 | 3,678 | ||
1,530 | 2006-07-06 | 3,429 | ||
1,529 | 2006-07-06 | 3,615 | ||
1,528 | 2006-07-06 | 3,721 | ||
1,527 |
댓글 추가 [1] |
정보문 |
2006-06-27 | 1,234 |
1,526 | 2006-06-27 | 3,681 | ||
1,525 | 2006-06-28 | 4,718 | ||
1,524 | 2006-06-28 | 3,337 | ||
1,523 | 2006-06-28 | 3,162 | ||
1,522 | 2006-06-28 | 3,126 | ||
2006-06-24 | 3,445 | |||
1,520 | 2006-06-24 | 3,292 | ||
1,519 |
re: 질문드립니다. [1] |
2006-06-24 | 3,208 | |
1,518 | 2006-06-20 | 3,331 | ||
1,517 |
밝은하늘 |
2006-06-08 | 1,279 | |
1,516 | 2006-06-09 | 3,337 | ||
1,515 |
밝은하늘 |
2006-06-09 | 1,134 | |
1,514 |
밝은하늘 |
2006-06-08 | 1,375 | |
1,513 | 2006-06-08 | 3,316 | ||
1,512 |
무관 |
2006-06-07 | 1,207 |