日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

數(shù)據(jù)挖掘-通過URL抓取網(wǎng)頁實(shí)例

系統(tǒng) 2128 0

當(dāng)你有幸搜索到這篇博客的時(shí)候,相比你已經(jīng)是以為資深的java程序大師。因此我下面所說的內(nèi)容你都會(huì)能看懂,因此簡(jiǎn)單的東西就不再敘述,如果有不懂的地方,可以加入數(shù)據(jù)挖掘群咨詢(群號(hào):224739996)。

首先我們的項(xiàng)目有MyEclipse8.6創(chuàng)建的maven項(xiàng)目,名稱crawlerDemo,如下:


數(shù)據(jù)挖掘-通過URL抓取網(wǎng)頁實(shí)例

通過指定的URL抓取網(wǎng)頁內(nèi)容

所謂網(wǎng)頁抓取,就是把URL地址中指定的網(wǎng)絡(luò)資源從網(wǎng)絡(luò)流中讀取出來,保存到本地。類似于使用程序模擬IE瀏覽器的功能,把URL作為HTTP請(qǐng)求的內(nèi)容發(fā)送到服務(wù)器端,然后讀取服務(wù)器端的響應(yīng)資源。

Java語言是為網(wǎng)絡(luò)而生的編程語言,它把網(wǎng)絡(luò)資源看成是一種文件,它對(duì)網(wǎng)絡(luò)資源的訪問和對(duì)本地文件的訪問一樣方便。它把請(qǐng)求和響應(yīng)封裝為流。因此我們可以根據(jù)相應(yīng)內(nèi)容,獲得響應(yīng)流,之后從流中按字節(jié)讀取數(shù)據(jù)。例如,java.net.URL類可以對(duì)相應(yīng)的Web服務(wù)器發(fā)出請(qǐng)求并且獲得響應(yīng)文檔。java.net.URL類有一個(gè)默認(rèn)的構(gòu)造函數(shù),使用URL地址作為參數(shù),構(gòu)造URL對(duì)象:

  1. URL?pageURL?=?new?URL(path);?

接著,可以通過獲得的URL對(duì)象來取得網(wǎng)絡(luò)流,進(jìn)而像操作本地文件一樣來操作網(wǎng)絡(luò)資源:

  1. InputStream?stream?=?pageURL.openStream();?

在實(shí)際的項(xiàng)目中,網(wǎng)絡(luò)環(huán)境比較復(fù)雜,因此,只用java.net包中的API來模擬IE客戶端的工作,代碼量非常大。需要處理HTTP返回的狀態(tài)碼,設(shè)置HTTP代理,處理HTTPS協(xié)議等工作。為了便于應(yīng)用程序的開發(fā),實(shí)際開發(fā)時(shí)常常使用Apache的HTTP客戶端開源項(xiàng)目--HttpClient。它完全能夠處理HTTP連接中的各種問題,使用起來非常方便。只需在項(xiàng)目中引入HttpClient.jar包,就可以模擬IE來獲取網(wǎng)頁內(nèi)容。例如:

      package crawlerDemo;

import java.io.IOException;

import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpException;
import org.apache.commons.httpclient.methods.GetMethod;

/**
 *通過指定的URL抓取網(wǎng)頁內(nèi)容DEMO
 *數(shù)據(jù)挖掘群號(hào):224739996
 */
public class httpClientDemo 
{
    public static void main( String[] args )
    {
    	//創(chuàng)建一個(gè)客戶端,類似于打開一個(gè)瀏覽器  
		HttpClient httpclient=new HttpClient();  
		 
		//創(chuàng)建一個(gè)get方法,類似于在瀏覽器地址欄中輸入一個(gè)地址  
		GetMethod getMethod=new GetMethod("http://zhengyunfei.iteye.com/blog/2190701");
    
      		 
		//回車,獲得響應(yīng)狀態(tài)碼  
		try {
			int statusCode=httpclient.executeMethod(getMethod);
			System.out.println("statusCode="+statusCode);
			//查看命中情況,可以獲得的東西還有很多,比如head、cookies等  
			System.out.println("response=" + getMethod.getResponseBodyAsString());  
		} catch (HttpException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}finally{
			//釋放  
			getMethod.releaseConnection(); 
		}
    }
}
運(yùn)行上面demo,結(jié)果如下:
    
      statusCode=200
2015-3-9 16:05:22 org.apache.commons.httpclient.HttpMethodBase getResponseBody
警告: Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
response=<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta http-equiv="Content-Script-Type" content="text/javascript">
<script type="text/javascript">
function getCookie(c_name) { // Local function for getting a cookie value
    if (document.cookie.length > 0) {
        c_start = document.cookie.indexOf(c_name + "=");
        if (c_start!=-1) {
        c_start=c_start + c_name.length + 1;
        c_end=document.cookie.indexOf(";", c_start);

        if (c_end==-1) 
            c_end = document.cookie.length;

        return unescape(document.cookie.substring(c_start,c_end));
        }
    }
    return "";
}
function setCookie(c_name, value, expiredays) { // Local function for setting a value of a cookie
    var exdate = new Date();
    exdate.setDate(exdate.getDate()+expiredays);
    document.cookie = c_name + "=" + escape(value) + ((expiredays==null) ? "" : ";expires=" + exdate.toGMTString()) + ";path=/";
}
function getHostUri() {
    var loc = document.location;
    return loc.toString();
}
setCookie('YPF8827340282Jdskjhfiw_928937459182JAX666', '220.231.3.154', 10);
try {  
    location.reload(true);  
} catch (err1) {  
    try {  
        location.reload();  
    } catch (err2) {  
    	location.href = getHostUri();  
    }  
}
</script>
</head>
<body>
<noscript>This site requires JavaScript and Cookies to be enabled. Please change your browser settings or upgrade your browser.</noscript>
</body>
</html>
    

?

上面的示例代碼是使用HttpClient進(jìn)行請(qǐng)求與響應(yīng)的例子。HttpClient httpclient=new HttpClient()表示創(chuàng)建一個(gè)客戶端,相當(dāng)于打開瀏覽器。GetMethod getMethod=new GetMethod("http://www.blablabla.com");使用get方式對(duì)http://www.blablabla.com進(jìn)行請(qǐng)求。int statusCode=httpclient.executeMethod(getMethod); 執(zhí)行請(qǐng)求,獲取響應(yīng)狀態(tài)。 getMethod.getResponseBodyAsString()方法能夠以字符串方式獲取返回的內(nèi)容。這也是網(wǎng)頁抓取所需要的內(nèi)容。在這個(gè)示例中,只是簡(jiǎn)單地把返回的內(nèi)容打印出來,而在實(shí)際項(xiàng)目中,通常需要把返回的內(nèi)容寫入本地文件并保存。最后還要關(guān)閉網(wǎng)絡(luò)連接,以免造成資源消耗。

?

? 這個(gè)例子是用get方式來訪問Web資源。通常,get請(qǐng)求方式把需要傳遞給服務(wù)器的參數(shù)作為URL的一部分傳遞給服務(wù)器。但是,HTTP協(xié)議本身對(duì)URL字符串長(zhǎng)度有所限制。因此不能傳遞過多的參數(shù)給服務(wù)器。為了避免這種問題,通常情況下,采用post方法進(jìn)行HTTP請(qǐng)求,HttpClient包對(duì)post方法也有很好的支持。例如:

?

    package crawlerDemo;

import java.io.IOException;

import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpException;
import org.apache.commons.httpclient.NameValuePair;
import org.apache.commons.httpclient.methods.PostMethod;

/**
 *通過指定的URL抓取網(wǎng)頁內(nèi)容DEMO
 *數(shù)據(jù)挖掘群號(hào):224739996
 */
public class HttpClientPostDemo 
{
    public static void main( String[] args )
    {
    	//創(chuàng)建一個(gè)客戶端,類似于打開一個(gè)瀏覽器  
		HttpClient httpclient=new HttpClient();  
		//創(chuàng)建一個(gè)post方法,類似于在瀏覽器地址欄中輸入一個(gè)地址  
		PostMethod postMethod=new PostMethod("http://www.pestreet.cn/query/article/1/searchResult.html");  
		//回車,獲得響應(yīng)狀態(tài)碼  
		try {
			//使用數(shù)組來傳遞參數(shù)  
			NameValuePair[] postData = new NameValuePair[1];  
			//設(shè)置參數(shù)  
			postData[0] = new NameValuePair("searchKey", "2015");  
			postMethod.addParameters(postData);  
			int statusCode=httpclient.executeMethod(postMethod);
			System.out.println("statusCode="+statusCode);
			//查看命中情況,可以獲得的東西還有很多,比如head、cookies等  
			System.out.println("response=" + postMethod.getResponseBodyAsString());  
		} catch (HttpException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		}finally{
			//釋放  
			postMethod.releaseConnection(); 
		}
    }
}

  

運(yùn)行結(jié)果如下:

    statusCode=200
2015-3-9 16:48:18 org.apache.commons.httpclient.HttpMethodBase getResponseBody
警告: Going to buffer response body of large or unknown size. Using getResponseBodyAsStream instead is recommended.
response=<!DOCTYPE html>
<html>
<head>
	<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
	<title>搜索結(jié)果-財(cái)富街</title>
<meta property="wb:webmaster" content="d9cb9a0148c6ce38" />
<link href="/style/Config.css" rel="stylesheet" />
<link href="/style/Default.css" rel="stylesheet" />
<link href="/scripts/component/select/select.css" rel="stylesheet" />
<script src="/scripts/lib/jquery.min.js" type="text/javascript"></script>
<script src="/scripts/lib/jquery.validate.min.js" type="text/javascript"></script>
<script src="/scripts/component/fts.js" type="text/javascript"></script>
<script src="/scripts/other/Config.js" type="text/javascript"></script>
<script src="/scripts/other/Menu.js" type="text/javascript"></script>
<script src="/scripts/other/Default.js" type="text/javascript"></script>
<script src="/scripts/other/DAds.js" type="text/javascript"></script>
<script src="/scripts/other/RightMenu.js" type="text/javascript"></script>
<script src="/scripts/component/pagination.js" type="text/javascript"></script>
<!--[if lt IE 9]><script src="/scripts/other/html5.js" language="javascript" type="text/javascript"></script><![endif]-->
<!--[if lt IE 7]>
	<script src="/scripts/other/DD_belatedPNG_0.0.8a.js" language="javascript" type="text/javascript"></script> 
	<script>
	  DD_belatedPNG.fix('*');
	</script>
<![endif]-->
	<link href="/style/List.css" rel="stylesheet" />
</head>

<body>
    <!-- Top start -->
<script src="/scripts/component/select/select.js" type="text/javascript"></script>
<script type="text/javascript">
	$(document).ready(function () {
		
		var datas = [{field : '私募股權(quán)', value : 'smgq', selected : true}, {field : '二級(jí)市場(chǎng)', value : 'ejsc'}, {field : '文章', value : 'article'}];
		
		$('#searchSelect').select({datas : datas, btn : $('#fs_select_button'), hidden : $('#fs_select_type'), defaultValue : 'article'});
		
		$('#searchKey').keydown(function(e) {
			var e = e || event,
			keycode = e.which || e.keyCode;
			if(keycode == 13) 
			{
				searchSubmit();
			}
		});
	});
	
	function searchSubmit() {
		var type = $('#fs_select_type').val();
		var searchKey = $('#searchKey').val();
		var url = '/query/' + type + '/1/searchResult.html?searchKey=' + encodeURI(encodeURI(searchKey));
		window.location.href = url;
		return false;
	}
	
</script>
<div class="header">
	<header>
		<h1><img src="/images/logo/Logo.jpg" alt="財(cái)富街" /></h1>
		<div class="TopSearch">
			<div id="searchSelect" class="searchSelect">
				<img src="/images/sbtn.png" id="fs_select_button" class="fs_select_button"/>
				<input type="hidden" id="fs_select_type" name="searchType" value=""/>
			</div>
			<input id="searchKey" name="searchKey" type="text" placeholder="Search" value="2015">
			<button type="button" id="searchSubmit" style="cursor:pointer" onclick="searchSubmit();"></button>
		</div>
		<h6><img src="/images/tel/TopTel.jpg" alt="熱線電話:4006547828" /></h6>
		<div class="ClearBoth"></div>
	</header>
	<nav>
		<ul>
			<li><a href="/index.html">首頁</a></li>
			<li id="Menu_1"><a href="javascript:void(0)">我要投資</a>
					<div id="SmallMenu_1" class="SmallMenu">
					<dl>
						<dd><a href="/smgq/1/56.html">私募股權(quán)</a></dd>
						<dd><a href="/sqtz/1/58.html">申請(qǐng)投資</a></dd>
					</dl>
				</div>
				</li>
			<li id="Menu_2"><a href="javascript:void(0)">我要募資</a>
					<div id="SmallMenu_2" class="SmallMenu">
					<dl>
						<dd><a href="/sqmz/1/61.html">申請(qǐng)募資</a></dd>
					</dl>
				</div>
				</li>
			<li id="Menu_3"><a href="javascript:void(0)">動(dòng)態(tài)與資訊</a>
					<div id="SmallMenu_3" class="SmallMenu">
					<dl>
						<dd><a href="/wzwslt/1/63.html">最新資訊</a></dd>
						<dd><a href="/wzwslt/1/64.html">行業(yè)風(fēng)云</a></dd>
						<dd><a href="/wzwslt/1/65.html">政策動(dòng)態(tài)</a></dd>
						<dd><a href="/wzslt/1/66.html">研究報(bào)告</a></dd>
						<dd><a href="/wzslt/1/67.html">專業(yè)排名</a></dd>
					</dl>
				</div>
				</li>
			<li id="Menu_4"><a href="javascript:void(0)">樂資會(huì)</a>
					<div id="SmallMenu_4" class="SmallMenu">
					<dl>
						<dd><a href="/jshyhd/1/70.html">樂資會(huì)簡(jiǎn)介</a></dd>
						<dd><a href="/jshyhd/1/71.html">會(huì)員權(quán)益</a></dd>
						<dd><a href="/hyhd/1/72.html">會(huì)員活動(dòng)</a></dd>
						<dd><a href="/downlb/1/73.html">會(huì)員下載專區(qū)</a></dd>
					</dl>
				</div>
				</li>
			<li id="Menu_5"><a href="javascript:void(0)">財(cái)富街課堂</a>
					<div id="SmallMenu_5" class="SmallMenu">
					<dl>
						<dd><a href="/wzwslt/1/108.html">私募股權(quán)課堂</a></dd>
						<dd><a href="/wzwslt/1/153.html">二級(jí)市場(chǎng)課堂</a></dd>
						<dd><a href="/wzwslt/1/154.html">更多知識(shí)</a></dd>
					</dl>
				</div>
				</li>
			<li id="Menu_6"><a href="javascript:void(0)">關(guān)于我們</a>
					<div id="SmallMenu_6" class="SmallMenu">
					<dl>
						<dd><a href="/statement/1/75.html">清科集團(tuán)簡(jiǎn)介</a></dd>
						<dd><a href="/statement/1/76.html">財(cái)富街簡(jiǎn)介</a></dd>
						<dd><a href="/statement/1/77.html">聯(lián)系我們</a></dd>
						<dd><a href="/statement/1/176.html">法律聲明</a></dd>
					</dl>
				</div>
				</li>
		</ul>
			<div class="Login"><a href="/user/userLogin.html">登錄</a>|<a href="/user/userRegister.html" class="Reg">注冊(cè)</a></div>		
		<div class="ClearBoth"></div>
	</nav>
</div>	<!-- Top End -->
    <!-- Main Start -->
    <div class="location">我要投資 > 搜索結(jié)果</div>    
    <section>
        <div class="detail">
            <div class="NewsList NewsListBox" style="background-color:#ffffff;">
		        <h4>搜索結(jié)果:43個(gè)</h4>
                <ul style="padding-top : 10px;">
		            <li>
		            	<h6><a href="/query/article/2015000000043994.html" target="_blank">投資聚焦Focus》總第96期:2015年私募基金七大政策爆點(diǎn)猜想</a></h6>
		            	<span>2015-03-09</span>
		            	<p>從2014年走來,私募基金已成為資本市場(chǎng)一股重要力量,年初監(jiān)管層大力推行備案制,在政策的規(guī)范下,隨著牛市的來臨,私募基金規(guī)模快速發(fā)展。</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043983.html" target="_blank">新三板2015投資攻略</a></h6>
		            	<span>2015-03-06</span>
		            	<p>2015年,隨著市場(chǎng)對(duì)競(jìng)價(jià)交易制度和分層管理的呼聲漸高,新三板將受到越來越多的投資者關(guān)注。從近期官方密集表態(tài)來看,新三板競(jìng)價(jià)交易有望于2015年中推出。214年8月做市商制度出臺(tái)后,曾大幅提升新三板公司估值。因此市場(chǎng)普遍預(yù)期,競(jìng)價(jià)交易推出后將進(jìn)一步提升新三板估值。</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043980.html" target="_blank">清科快評(píng):總理報(bào)告首提“互聯(lián)網(wǎng)+”,2015互聯(lián)網(wǎng)金融迎風(fēng)口機(jī)遇</a></h6>
		            	<span>2015-03-06</span>
		            	<p>監(jiān)管層已經(jīng)充分意識(shí)到現(xiàn)有的政策法規(guī)并不完全適用于互聯(lián)網(wǎng)金融,為使得其獲得一個(gè)健康完善的發(fā)展環(huán)境,2015年政府將創(chuàng)新金融監(jiān)管,防范和化解金融風(fēng)險(xiǎn)。大力發(fā)展普惠金融,讓所有市場(chǎng)主體都能享受到金融服務(wù)。</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043969.html" target="_blank">清科觀察:《2015天使投資白皮書》出爐,國(guó)家支持"眾創(chuàng)空間"將再燃投資熱情</a></h6>
		            	<span>2015-03-06</span>
		            	<p>2014年全國(guó)科技企業(yè)孵化器數(shù)量超過1600家,國(guó)家級(jí)孵化器達(dá)約600家,非國(guó)家級(jí)超過1000家,在孵企業(yè)8萬余家,累計(jì)孵化企業(yè)約6萬家。除了推動(dòng)孵化器的建設(shè)以外,“眾創(chuàng)空間”概念還包括了各類創(chuàng)客空間以及交流平臺(tái)的搭建。</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043968.html" target="_blank"> 2015年值得關(guān)注的10家硬件創(chuàng)業(yè)公司</a></h6>
		            	<span>2015-03-05</span>
		            	<p>過去幾年軟件初創(chuàng)公司更容易博得人們的關(guān)注,如各種各樣的社交應(yīng)用、手機(jī)游戲等。隨著眾籌平臺(tái)越來越熱門,更多硬件初創(chuàng)公司也開始發(fā)力。以下的10家公司或許有望憑借優(yōu)秀的產(chǎn)品在2015年成為業(yè)界關(guān)注的焦點(diǎn)。</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043961.html" target="_blank">2015年兩會(huì)股市猜想(附歷年兩會(huì)股市行情)</a></h6>
		            	<span>2015-03-05</span>
		            	<p>一年一度的全國(guó)兩會(huì)即將拉開帷幕,每年的兩會(huì)都是投資者關(guān)注的重點(diǎn),將釋放怎樣的全年經(jīng)濟(jì)發(fā)展脈絡(luò),哪些概念、板塊將成為熱點(diǎn),兩會(huì)期間又是否會(huì)有一波特色的“兩會(huì)行情”?</p>
		            </li>
		            <li>
		            	<h6><a href="/query/article/2015000000043959.html" target="_blank">2015全球超級(jí)富豪排名發(fā)布 中國(guó)新入榜人數(shù)超美國(guó)</a></h6>
		            	<span>2015-03-05</span>
		            	<p>2015年福布斯全球億萬富豪榜近日正式發(fā)布,入榜名單上,都是世界范圍內(nèi)個(gè)人或家族凈資產(chǎn)超過10億美元的超級(jí)富豪。據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,今年新增入榜人數(shù)為290人,其中71人來自中國(guó),57位來自美國(guó)。</p>
		            </li>
                </ul>
 
	<!-- 分頁請(qǐng)求處理 -->
 
 	
	
	<input type="hidden" name="pageNo" value="1"/>
	<input type="hidden" name="pageSize" value="7"/>
	
	
	

	<div class="PageBox">當(dāng)前:1/7
	
		
		
			<span>1</span>
			<a href="javascript:void(0);" onclick="turnOverPage(2);">2</a>      
		  
			&hellip;  
			<a href="javascript:void(0);" onclick="turnOverPage(6);">6</a>
			<a href="javascript:void(0);" onclick="turnOverPage(7);">7</a>
		共:43 條
	</div>
	<script language="javascript">
		function turnOverPage(no){
	  		var url = '/query/article/(no)/searchResult.html?searchKey=2015';
	  		if(url.indexOf('func:') == 0) 
	  		{
	  			var fName = url.replace('func:', '');
	  			window[fName](no);
	  		}
	  		else
	  		{
		  		var lh = url.replace(/\(no\)/, no);
		  		window.location.href = encodeURI(encodeURI(lh));
	  		}
		}
	</script>
            </div>
        </div>
        <aside>
<div class="Right_Service">
    <h6>“太好了,我有興趣”</h6>
    <p class="Con">撥打400電話或網(wǎng)頁對(duì)話投資顧問,獲得1對(duì)1專家服務(wù)</p>
    <p class="Btn Border"><img src="/images/button/Right_ZxBtn2.jpg" style="cursor:pointer;" onclick="notic();" alt="投資顧問聯(lián)系" />&nbsp;<img src="/images/button/Right_TelBtn2.jpg" alt="撥打400電話" /></p>
    <p class="Box">加入樂資會(huì)微信微博<br />搶注第一手投資機(jī)會(huì)</p>
    <p><img src="/images/Right_ewm2.jpg" alt="二維碼" /></p>
</div>
<script type="text/javascript">
	function notic() {
		
		$.ajax({
			url : fts.baseURI + '/notic/send',
			type : 'POST',
			timeout : '1000',
			async : false,
			dataType : 'json',
			success : function(responseText) {
				var result = responseText.result;
				var isRelation = responseText.relation;
				var message = responseText.message;
				if(result) 
				{
					if(isRelation) 
					{
						if(confirm("投資顧問已經(jīng)聯(lián)系過您,是否需要再次取得投資顧問聯(lián)系?")) 
						{
							updateStatus();
						}
					}
					else {
						alert(message);	
					}
				}
				else
				{
					window.location.href = "/user/userLogin.html"
				}
			}
		});
	}
	
	function updateStatus() {
		$.ajax({
			url : fts.baseURI + '/notic/updateStatus',
			type : 'POST',
			timeout : '1000',
			async : false,
			dataType : 'json',	
			success : function(response) {
				var r = response.result;
				var m = response.message;
				if(r) 
				{
					alert(m);	
				}
			}
		});	
	}
</script>        </aside>
        <div class="ClearTab"></div>
    </section>
    <!-- Main End -->
	<!-- footer Start -->
<div class="footer">
	<div class="EndMenu">
				<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">我要投資</a></dt>
				<dd><a href="/smgq/1/56.html" style="color:#f2f2f2;">私募股權(quán)</a></dd>
				<dd><a href="/sqtz/1/58.html" style="color:#f2f2f2;">申請(qǐng)投資</a></dd>
		</dl>
		<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">我要募資</a></dt>
				<dd><a href="/sqmz/1/61.html" style="color:#f2f2f2;">申請(qǐng)募資</a></dd>
		</dl>
		<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">動(dòng)態(tài)與資訊</a></dt>
				<dd><a href="/wzwslt/1/63.html" style="color:#f2f2f2;">最新資訊</a></dd>
				<dd><a href="/wzwslt/1/64.html" style="color:#f2f2f2;">行業(yè)風(fēng)云</a></dd>
				<dd><a href="/wzwslt/1/65.html" style="color:#f2f2f2;">政策動(dòng)態(tài)</a></dd>
				<dd><a href="/wzslt/1/66.html" style="color:#f2f2f2;">研究報(bào)告</a></dd>
				<dd><a href="/wzslt/1/67.html" style="color:#f2f2f2;">專業(yè)排名</a></dd>
		</dl>
		<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">樂資會(huì)</a></dt>
				<dd><a href="/jshyhd/1/70.html" style="color:#f2f2f2;">樂資會(huì)簡(jiǎn)介</a></dd>
				<dd><a href="/jshyhd/1/71.html" style="color:#f2f2f2;">會(huì)員權(quán)益</a></dd>
				<dd><a href="/hyhd/1/72.html" style="color:#f2f2f2;">會(huì)員活動(dòng)</a></dd>
				<dd><a href="/downlb/1/73.html" style="color:#f2f2f2;">會(huì)員下載專區(qū)</a></dd>
		</dl>
		<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">財(cái)富街課堂</a></dt>
				<dd><a href="/wzwslt/1/108.html" style="color:#f2f2f2;">私募股權(quán)課堂</a></dd>
				<dd><a href="/wzwslt/1/153.html" style="color:#f2f2f2;">二級(jí)市場(chǎng)課堂</a></dd>
				<dd><a href="/wzwslt/1/154.html" style="color:#f2f2f2;">更多知識(shí)</a></dd>
		</dl>
		<dl>
			<dt><a href="javascript:void(0);" style="color:#f2f2f2; font-weight:700;">關(guān)于我們</a></dt>
				<dd><a href="/statement/1/75.html" style="color:#f2f2f2;">清科集團(tuán)簡(jiǎn)介</a></dd>
				<dd><a href="/statement/1/76.html" style="color:#f2f2f2;">財(cái)富街簡(jiǎn)介</a></dd>
				<dd><a href="/statement/1/77.html" style="color:#f2f2f2;">聯(lián)系我們</a></dd>
				<dd><a href="/statement/1/176.html" style="color:#f2f2f2;">法律聲明</a></dd>
		</dl>
		<div class="EndContact">
			<p>
				北京市朝陽區(qū)霄云路26號(hào)鵬潤(rùn)大廈A座12層1203室<br />
				聯(lián)系電話:+86 10 84580476<br />傳真:+86 10 84584529
			</p>
			<ul>
				<li class="wb" onclick="window.open('http://weibo.com/pwmchina')" style="cursor:pointer">新浪微博</li>
				<li class="wx" onclick="window.open('/75/wx.html')" style="cursor:pointer">微信</li>
			</ul>
			<div class="ClearBoth"></div>
		</div>
		<div class="ClearTab"></div>
	</div>
	<footer>
		Copyright @ 2012 Tooks All Rights Reserved        京ICP備12000166號(hào)<br>
		京公網(wǎng)安備11010502026892號(hào)
	</footer>
</div>
<div style="display:none;">
<script type="text/javascript">
var _bdhmProtocol = (("https:" == document.location.protocol) ? " https://" : " http://");
document.write(unescape("%3Cscript src='" + _bdhmProtocol + "hm.baidu.com/h.js%3F7f253a0a0746530f430fcca8f1933364' type='text/javascript'%3E%3C/script%3E"));
</script>
</div>	<!-- footer End -->
</body>
</html>

  

??

上面的例子說明了如何使用post方法來訪問Web資源。與get方法不同,post方法可以使用NameValuePair來設(shè)置參數(shù),因此可以設(shè)置"無限"多的參數(shù)。而get方法采用把參數(shù)寫在URL里面的方式,由于URL有長(zhǎng)度限制,因此傳遞參數(shù)的長(zhǎng)度會(huì)有限制。

?

?

?

?

??

?

數(shù)據(jù)挖掘-通過URL抓取網(wǎng)頁實(shí)例


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫作最大的動(dòng)力,如果您喜歡我的文章,感覺我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 山阳县| 额济纳旗| 万年县| 荆州市| 汤阴县| 绍兴县| 乌兰浩特市| 富锦市| 永康市| 新巴尔虎左旗| 尼勒克县| 瓮安县| 上虞市| 那坡县| 万载县| 竹溪县| 师宗县| 定州市| 文登市| 内江市| 车致| 麦盖提县| 十堰市| 贵德县| 汽车| 台州市| 彭泽县| 宜川县| 古交市| 桦南县| 乌拉特前旗| 嘉定区| 青岛市| 漳浦县| 章丘市| 交城县| 镇巴县| 崇仁县| 盈江县| 沁阳市| 玛沁县|