Eu tenho uma lista de Uri's que desejo "clicar" Para conseguir isso, estou tentando criar um novo controle de navegador da Web por Uri. Crio um novo thread por Uri. O problema que estou tendo é o fim do thread antes do documento está totalmente carregado, então nunca consigo fazer uso do evento DocumentComplete. Como posso superar isso?
var item = new ParameterizedThreadStart(ClicIt.Click);
var thread = new Thread(item) {Name = "ClickThread"};
thread.Start(uriItem);
public static void Click(object o)
{
var url = ((UriItem)o);
Console.WriteLine(@"Clicking: " + url.Link);
var clicker = new WebBrowser { ScriptErrorsSuppressed = true };
clicker.DocumentCompleted += BrowseComplete;
if (String.IsNullOrEmpty(url.Link)) return;
if (url.Link.Equals("about:blank")) return;
if (!url.Link.StartsWith("http://") && !url.Link.StartsWith("https://"))
url.Link = "http://" + url.Link;
clicker.Navigate(url.Link);
}
c#
multithreading
browser
Art W
fonte
fonte
WebBrowser
objeto ativo (para salvar o estado / cookies etc.) e realizar váriasNavigate()
chamadas ao longo do tempo. Mas não tenho certeza de onde fazer minhaApplication.Run()
chamada, porque ela bloqueia a execução de mais códigos. Alguma pista?Application.Exit();
para deixarApplication.Run()
voltar.Aqui está como organizar um loop de mensagem em um thread não-UI, para executar tarefas assíncronas como
WebBrowser
automação. Ele usaasync/await
para fornecer o fluxo de código linear conveniente e carrega um conjunto de páginas da web em um loop. O código é um aplicativo de console pronto para rodar parcialmente baseado neste excelente post .Respostas relacionadas:
using System; using System.Threading; using System.Threading.Tasks; using System.Windows.Forms; namespace ConsoleApplicationWebBrowser { // by Noseratio - https://stackoverflow.com/users/1768303/noseratio class Program { // Entry Point of the console app static void Main(string[] args) { try { // download each page and dump the content var task = MessageLoopWorker.Run(DoWorkAsync, "http://www.example.com", "http://www.example.net", "http://www.example.org"); task.Wait(); Console.WriteLine("DoWorkAsync completed."); } catch (Exception ex) { Console.WriteLine("DoWorkAsync failed: " + ex.Message); } Console.WriteLine("Press Enter to exit."); Console.ReadLine(); } // navigate WebBrowser to the list of urls in a loop static async Task<object> DoWorkAsync(object[] args) { Console.WriteLine("Start working."); using (var wb = new WebBrowser()) { wb.ScriptErrorsSuppressed = true; TaskCompletionSource<bool> tcs = null; WebBrowserDocumentCompletedEventHandler documentCompletedHandler = (s, e) => tcs.TrySetResult(true); // navigate to each URL in the list foreach (var url in args) { tcs = new TaskCompletionSource<bool>(); wb.DocumentCompleted += documentCompletedHandler; try { wb.Navigate(url.ToString()); // await for DocumentCompleted await tcs.Task; } finally { wb.DocumentCompleted -= documentCompletedHandler; } // the DOM is ready Console.WriteLine(url.ToString()); Console.WriteLine(wb.Document.Body.OuterHtml); } } Console.WriteLine("End working."); return null; } } // a helper class to start the message loop and execute an asynchronous task public static class MessageLoopWorker { public static async Task<object> Run(Func<object[], Task<object>> worker, params object[] args) { var tcs = new TaskCompletionSource<object>(); var thread = new Thread(() => { EventHandler idleHandler = null; idleHandler = async (s, e) => { // handle Application.Idle just once Application.Idle -= idleHandler; // return to the message loop await Task.Yield(); // and continue asynchronously // propogate the result or exception try { var result = await worker(args); tcs.SetResult(result); } catch (Exception ex) { tcs.SetException(ex); } // signal to exit the message loop // Application.Run will exit at this point Application.ExitThread(); }; // handle Application.Idle just once // to make sure we're inside the message loop // and SynchronizationContext has been correctly installed Application.Idle += idleHandler; Application.Run(); }); // set STA model for the new thread thread.SetApartmentState(ApartmentState.STA); // start the thread and await for the task thread.Start(); try { return await tcs.Task; } finally { thread.Join(); } } } }
fonte
task.Wait();
. Eu estou fazendo algo errado ?Pela minha experiência anterior, o navegador da web não gosta de operar fora do thread principal do aplicativo.
Tente usar httpwebrequests, você pode defini-los como assíncronos e criar um manipulador para a resposta para saber quando ela é bem-sucedida:
how-to-use-httpwebrequest-net-asynchronously
fonte
webRequest.Credentials = CredentialsCache.DefaultCredentials;
Credentials
propriedade do objeto e como preencher o HTML.WindowsIdentity.GetCurrent().Name
após implementar a representação e testá-los em uma pesquisa do AD, se desejar. Não tenho certeza de como os cookies e o cache seriam usados para isso.WebBrowser
que indicaria que as páginas HTML estão sendo carregadas, OP até disse queWebRequest
não vai conseguir o que deseja, portanto, se um site espera entrada de HTML para o login, a configuração doCredentials
objeto não funcionará. Além disso, como diz OP, os sites incluem Facebook; A autenticação do Windows não funcionará nisso.Uma solução simples em que ocorre o funcionamento simultâneo de vários WebBrowsers
Escreva o seguinte manipulador de clique em button1:
textBox1.Clear(); textBox1.AppendText(DateTime.Now.ToString() + Environment.NewLine); int completed_count = 0; int count = 10; for (int i = 0; i < count; i++) { int tmp = i; this.BeginInvoke(new Action(() => { var wb = new WebBrowser(); wb.ScriptErrorsSuppressed = true; wb.DocumentCompleted += (cur_sender, cur_e) => { var cur_wb = cur_sender as WebBrowser; if (cur_wb.Url == cur_e.Url) { textBox1.AppendText("Task " + tmp + ", navigated to " + cur_e.Url + Environment.NewLine); completed_count++; } }; wb.Navigate("/programming/4269800/webbrowser-control-in-a-new-thread"); } )); } while (completed_count != count) { Application.DoEvents(); Thread.Sleep(10); } textBox1.AppendText("All completed" + Environment.NewLine);
fonte