Come estrarre la tabella html usando Beautifulsoup

Prendendo il seguente frammento di codice HTML come esempio:

>>>soup 
This is ABC
data1_xxx
This is EFG
data1_xxx

Se riesco a trovare la mia tabella dei desideri solo in base alla class dati della tabella,

 >>>soup.findAll("td",{"class":"abc"}) [This is ABC] 

come posso estrarre l’intera tabella come segue?

 
This is ABC
data1_xxx

Ottieni il parent del tag td usando find_parent() :

 soup.find("td", {"class":"abc"}).find_parent('table') 

demo:

 >>> from bs4 import BeautifulSoup >>> data = """ ... 
... ... ... ... ... ...
This is ABC
data1_xxx
... ... ... ... ... ... ...
This is EFG
data1_xxx
...
... """ >>> soup = BeautifulSoup(data) >>> print soup.find("td", {"class":"abc"}).find_parent('table')
This is ABC
data1_xxx