Я пишу парсер, используя FSharp.Collections.ParallelSeq
и повторить вычисление. Я хотел бы получать HTML-код с нескольких страниц параллельно и повторять запросы, когда они терпят неудачу.
Например:
open System
open FSharp.Collections.ParallelSeq
type RetryBuilder(max) =
member x.Return(a) = a // Enable 'return'
member x.Delay(f) = f // Gets wrapped body and returns it (as it is)
// so that the body is passed to 'Run'
member x.Zero() = failwith "Zero" // Support if .. then
member x.Run(f) = // Gets function created by 'Delay'
let rec loop(n) =
if n = 0 then failwith "Failed" // Number of retries exceeded
else try f() with _ -> loop(n-1)
loop max
let retry = RetryBuilder(4)
let getHtml (url : string) = retry {
Console.WriteLine("Get Url")
return 0;
}
//A property/field?
let GetHtmlForAllPages =
let pages = {1 .. 10}
let allHtml = pages |> PSeq.map(fun x -> getHtml("http://somesite.com/" + x.ToString())) |> Seq.toArray
allHtml
[<EntryPoint>]
let main argv =
let htmlForAllPages = GetHtmlForAllPages
0 // return an integer exit code
Когда я пытаюсь взаимодействовать с GetHtmlForAllPages
из main
, код кажется зависшим. Пошаговое выполнение кода показывает, что PSeq.map
начинает работать с первыми четырьмя значениями pages
.
Что происходит, из-за чего выражение вычисления retry
никогда не запускается/не завершается? Есть какое-то странное взаимодействие между PSeq
и retry
?
Код работает, как и ожидалось, если я сделаю GetHtmlForAllPages
функцией и вызову ее. Мне любопытно, что происходит, когда GetHtmlForAllPages
является полем?