<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<!--[if !mso]><style>v\:* {behavior:url(#default#VML);}
o\:* {behavior:url(#default#VML);}
w\:* {behavior:url(#default#VML);}
.shape {behavior:url(#default#VML);}
</style><![endif]--><style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
@font-face
        {font-family:Aptos;
        panose-1:0 0 0 0 0 0 0 0 0 0;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p
        {mso-style-priority:99;
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
code
        {mso-style-priority:99;
        font-family:"Courier New";}
pre
        {mso-style-priority:99;
        mso-style-link:"Formateret HTML Tegn";
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman",serif;}
span.FormateretHTMLTegn
        {mso-style-name:"Formateret HTML Tegn";
        mso-style-priority:99;
        mso-style-link:"Formateret HTML";
        font-family:Consolas;}
span.EmailStyle22
        {mso-style-type:personal;
        font-family:"Calibri",sans-serif;
        color:#1F497D;}
span.EmailStyle23
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:3.0cm 2.0cm 3.0cm 2.0cm;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body lang="DA" link="blue" vlink="purple">
<div class="WordSection1">
<p><span style="font-family:"Calibri",sans-serif">Hi<o:p></o:p></span></p>
<p><span style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">It looks like it will need to have a cookie in the request and/or response header to work.<o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">Can you see in the WARC file if the response header from  https://www.lineaverdesierraguadarrama.com has the cookie information set?<o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif"><o:p> </o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">Best regards,<o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif">Stephen</span><span lang="EN-US" style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<div>
<div class="MsoNormal" align="center" style="text-align:center"><span style="font-family:"Calibri",sans-serif;color:black">
<hr size="2" width="98%" align="center">
</span></div>
<div id="divRplyFwdMsg">
<p class="MsoNormal"><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:black">Fra:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:black"> NetarchiveSuite-users <<a href="mailto:netarchivesuite-users-bounces@ml.sbforge.org">netarchivesuite-users-bounces@ml.sbforge.org</a>>
 på vegne af Bjarne Andersen <<a href="mailto:bja@kb.dk">bja@kb.dk</a>><br>
<b>Sendt:</b> 7. november 2025 14:49<br>
<b>Til:</b> <a href="mailto:netarchivesuite-users@ml.sbforge.org">netarchivesuite-users@ml.sbforge.org</a><br>
<b>Emne:</b> Re: [Netarchivesuite-users] Problems with a seed</span><span style="font-family:"Calibri",sans-serif;color:black">
<o:p></o:p></span></p>
<div>
<p class="MsoNormal"><span style="font-family:"Calibri",sans-serif;color:black"> <o:p></o:p></span></p>
</div>
</div>
<div>
<div>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">The curl-command gives me a 200 as well</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">bja@bja-linux3:~$ curl -LsI
<a href="https://www.lineaverdesierraguadarrama.com/">https://www.lineaverdesierraguadarrama.com/</a></span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">HTTP/2 200</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">cache-control: private</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">content-length: 16857</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">content-type: text/html</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">server: Microsoft-IIS/10.0</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">set-cookie: ASPSESSIONIDAGCQDTSQ=FLPBDMPCLICDHIBNHPHCOIGN; secure; path=/</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">x-powered-by: ASP.NET</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">x-powered-by-plesk: PleskWin</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">date: Fri, 07 Nov 2025 13:47:12 GMT</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">could it be something with User-Agent that gives different results (just a guess)</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">best</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D">Bjarne</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:#1F497D"> </span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<div>
<div style="border:none;border-top:solid #E1E1E1 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p><b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:black">From:</span></b><span style="font-size:11.0pt;font-family:"Calibri",sans-serif;color:black"> NetarchiveSuite-users <<a href="mailto:netarchivesuite-users-bounces@ml.sbforge.org">netarchivesuite-users-bounces@ml.sbforge.org</a>>
<b>On Behalf Of </b>Soleto Ruiz de Clavijo, Miguel<br>
<b>Sent:</b> Friday, November 7, 2025 11:43 AM<br>
<b>To:</b> 'NetarchiveSuite-users@ml.sbforge.org' <<a href="mailto:netarchivesuite-users@ml.sbforge.org">netarchivesuite-users@ml.sbforge.org</a>><br>
<b>Subject:</b> [Netarchivesuite-users] Problems with a seed</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
</div>
</div>
<p><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"> <o:p></o:p></span></p>
<p><span lang="ES" style="font-size:11.0pt;font-family:"Aptos",serif;color:black">Dear all,</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-size:11.0pt;font-family:"Aptos",serif;color:black"> </span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-family:"Calibri",sans-serif;color:black">I’m having trouble downloading a site with NAS. Specifically, it’s this seed:
<a href="https://www.lineaverdesierraguadarrama.com/" target="_new"><span style="color:#0563C1">https://www.lineaverdesierraguadarrama.com/</span></a><br>
When I start the job, it returns a 404, but that URL works fine in a browser.</span><span style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-family:"Calibri",sans-serif;color:black">I ran the following tests:</span><span style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<pre><span lang="ES" style="color:black">curl<code> </code>-LsI<code> </code><a href="https://www.lineaverdesierraguadarrama.com/"><span style="color:#0563C1">https://www.lineaverdesierraguadarrama.com/</span></a></span><span style="color:black"><o:p></o:p></span></pre>
<pre><b><span lang="ES" style="color:black">HTTP/2<code> </code>404</span></b><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">content-length:<code> </code>1245</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">content-type:<code> </code>text/html</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">server:<code> </code>Microsoft-IIS/10.0</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">x-powered-by:<code> </code>ASP.NET</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">x-powered-by-plesk:<code> </code>PleskWin</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">date:<code> </code>Fri,<code> </code>07<code> </code>Nov<code> </code>2025 08:43:09 GMT</span><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black"> </span><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span style="color:black"> </span></code><span style="color:black"><o:p></o:p></span></pre>
<pre><span lang="ES" style="color:black">wget<code> </code><a href="https://www.lineaverdesierraguadarrama.com/"><span style="color:#0563C1">https://www.lineaverdesierraguadarrama.com/</span></a></span><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">--</span></code><span lang="ES" style="color:black">2025<code>-</code>11<code>-</code>07<code> </code>09<code>:</code>43<code>:</code>16<code>--  <a href="https://www.lineaverdesierraguadarrama.com/"><span style="color:#0563C1">https://www.lineaverdesierraguadarrama.com/</span></a></code></span><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">Resolving <a href="http://www.lineaverdesierraguadarrama.com"><span style="color:#0563C1">www.lineaverdesierraguadarrama.com</span></a> (<a href="http://www.lineaverdesierraguadarrama.com"><span style="color:#0563C1">www.lineaverdesierraguadarrama.com</span></a>)... </span></code><span lang="ES" style="color:black">195.55.124.177</span><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">Connecting to <a href="http://www.lineaverdesierraguadarrama.com"><span style="color:#0563C1">www.lineaverdesierraguadarrama.com</span></a> (<a href="http://www.lineaverdesierraguadarrama.com)[195.55.124.177]:443"><span style="color:#0563C1">www.lineaverdesierraguadarrama.com)[195.55.124.177]:443</span></a>... connected.</span></code><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">HTTP request sent, awaiting response... </span></code><b><span lang="ES" style="color:black">200<code> OK</code></span></b><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">Length: </span></code><span lang="ES" style="color:black">16857<code> (</code>16K<code>) [text/html]</code></span><span style="color:black"><o:p></o:p></span></pre>
<pre><code><span lang="ES" style="color:black">Saving to: “index.html.</span></code><span lang="ES" style="color:black">1<code>”</code></span><span style="color:black"><o:p></o:p></span></pre>
<p><span lang="ES" style="font-family:"Calibri",sans-serif;color:black">It seems the server responds with a 404 when it receives a HEAD request.<br>
Is there any way to configure the Heritrix template to make it use GET directly?</span><span style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-family:"Calibri",sans-serif;color:black">Thanks in advance.</span><span style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-family:"Calibri",sans-serif;color:black">Best regards.</span><span style="font-family:"Calibri",sans-serif;color:black"><o:p></o:p></span></p>
<p><span lang="ES" style="font-size:11.0pt;font-family:"Aptos",serif;color:black"> </span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<div class="MsoNormal" align="center" style="text-align:center"><span lang="ES" style="color:black">
<hr size="2" width="100%" align="center">
</span></div>
<p><span lang="ES" style="font-size:7.5pt;color:black">Este mensaje y cualquier fichero adjunto están dirigidos únicamente a sus destinatarios y contiene información confidencial. Si usted ha recibido este correo electrónico por error, le informamos que no
 puede realizar ninguna revisión, alteración, impresión, copia, transmisión, difusión ni utilización alguna de este mensaje ni de cualquier fichero adjunto que pudiese contener. La realización de cualquiera de los actos indicados está expresamente prohibida
 por las Normas que regulan estas materias. Por todo ello se solicita que, en caso de existir error en la recepción de este mensaje, se lo notifique al remitente respondiendo a este e-mail y elimine el mensaje y su contenido inmediatamente. La Biblioteca Nacional
 de España se reserva las acciones legales que le correspondan en el caso de que se infrinja lo indicado anteriormente.</span><span lang="ES" style="color:black">
</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<div class="MsoNormal" align="center" style="text-align:center"><span lang="ES" style="color:black">
<hr size="2" width="100%" align="center">
</span></div>
<p><span lang="ES" style="font-size:7.5pt;color:black">The information in this e-mail and any attachments is confidential and it is intended for the addressee only. If you have received this e-mail in error, you are notified that any revision, amendment, print,
 copy, disclosure, distribution or use of the contents is unauthorized. Carrying out any of the above actions, is expressly banned by rules governing this matter. Hence we request that if you are not the intended recipient, please notify the sender answering
 this e-mail, and delete the message and any attachments. The National Library of Spain reserves itself the right to take the appropriate legal actions in the event of the above mentioned matter is being infringed.</span><span lang="ES" style="color:black">
</span><span style="font-size:11.0pt;font-family:"Aptos",serif;color:black"><o:p></o:p></span></p>
<div class="MsoNormal" align="center" style="text-align:center"><span lang="ES" style="color:black">
<hr size="2" width="100%" align="center">
</span></div>
</div>
</div>
</div>
</div>
</body>
</html>