<div dir="ltr">Sendfile is now off, using select, and still the same...<br><a href="http://pastebin.com/m2c3ea25b">http://pastebin.com/m2c3ea25b</a><br><br>Yo&#39;av<br><br><div class="gmail_quote">On Sun, Jan 25, 2009 at 7:33 PM, Igor Sysoev <span dir="ltr">&lt;<a href="mailto:is@rambler-co.ru">is@rambler-co.ru</a>&gt;</span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div class="Ih2E3d">On Sun, Jan 25, 2009 at 06:26:58PM +0200, Yo&#39;av Moshe wrote:<br>
<br>
&gt; Igor, I tried using select instead of poll, but I get the exact same<br>
&gt; problem.<br>
&gt;<br>
&gt; Check my strace:<br>
&gt; <a href="http://pastebin.com/m65056ec0" target="_blank">http://pastebin.com/m65056ec0</a><br>
&gt;<br>
&gt; I get the same thing with rtsig too.<br>
&gt;<br>
&gt; Hints?<br>
&gt; Again, file is at <a href="http://www.noal.org.il/static/temp/hozer.pdf" target="_blank">http://www.noal.org.il/static/temp/hozer.pdf</a>. Server is<br>
&gt; using select now.<br>
<br>
</div>According strace select() does not return event for socket 19 after<br>
sendfile64() sent 1651005 bytes:<br>
<br>
25951 18:14:26 select(20, [7 8 16 19], [19], NULL, {60, 0} &lt;unfinished ...&gt;<br>
25951 18:14:27 &lt;... select resumed&gt; ) &nbsp; = 1 (out [19], left {58, 790000})<br>
<br>
25951 18:14:27 gettimeofday({1232900067, 890376}, NULL) = 0<br>
25951 18:14:27 sendfile64(19, 20, [1509465], 440765 &lt;unfinished ...&gt;<br>
25951 18:14:27 &lt;... sendfile64 resumed&gt; ) = 141540<br>
25951 18:14:27 sendfile64(19, 20, [1651005], 299225 &lt;unfinished ...&gt;<br>
25951 18:14:27 &lt;... sendfile64 resumed&gt; ) = -1 EAGAIN (Resource temporarily unavailable)<br>
<br>
25951 18:14:27 select(20, [16 19], [19], NULL, {0, 500000} &lt;unfinished ...&gt;<br>
25951 18:14:28 &lt;... select resumed&gt; ) &nbsp; = 0 (Timeout)<br>
<br>
As you have got the same issue with all methods (even with level triggered<br>
select()), I believe that the bug is in sendfile. You may try to turn<br>
it off even for the single file:<br>
<br>
 &nbsp; &nbsp;location = /static/temp/hozer.pdf {<br>
 &nbsp; &nbsp; &nbsp; &nbsp;sendfile off;<br>
 &nbsp; &nbsp;}<br>
<br>
In Linux 2.6.23 sendfile() has been rewritten to use splice framework.<br>
The bug may be introduced while rewriting.<br>
<br>
BTW, it seems that thttpd does not use sendfile.<br>
<div><div></div><div class="Wj3C7c"><br>
&gt; Thanks...<br>
&gt; Yo&#39;av.<br>
&gt;<br>
&gt; On Fri, Jan 23, 2009 at 3:05 PM, Igor Sysoev &lt;<a href="mailto:is@rambler-co.ru">is@rambler-co.ru</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; On Fri, Jan 23, 2009 at 02:35:00PM +0200, Yo&#39;av Moshe wrote:<br>
&gt; &gt;<br>
&gt; &gt; &gt; Thanks Igor.<br>
&gt; &gt; &gt; I don&#39;t want to be rude, but I find it hard to believe that it&#39;s a kernel<br>
&gt; &gt; &gt; bug.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; First, I&#39;m using the default CentOS 5.2 kernel, it&#39;s seems to me pretty<br>
&gt; &gt; odd<br>
&gt; &gt; &gt; that there&#39;s such a bug in it. CentOS is being used on a lot of servers,<br>
&gt; &gt; &gt; some of them must be running nginx.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Second, I tried serving the same file with thttpd, and it runs just fine.<br>
&gt; &gt; &gt; <a href="http://195.28.180.147:40/temp/hozer.pdf" target="_blank">http://195.28.180.147:40/temp/hozer.pdf</a><br>
&gt; &gt; &gt; Note it&#39;s the exact same file which I cannot get from nginx:<br>
&gt; &gt; &gt; <a href="http://www.noal.org.il/static/temp/hozer.pdf" target="_blank">http://www.noal.org.il/static/temp/hozer.pdf</a><br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; How come thttpd can serve the file just fine? If it&#39;s a kernel bug, I<br>
&gt; &gt; &gt; thought it would happen with all of my servers.<br>
&gt; &gt; &gt; If it&#39;s using some different way of sending the files which does not<br>
&gt; &gt; depend<br>
&gt; &gt; &gt; on that epoll call - is there any way to configure nginx to use that as<br>
&gt; &gt; &gt; well?<br>
&gt; &gt;<br>
&gt; &gt; I do not look modern thttpd, but according its change log, it has no<br>
&gt; &gt; epoll support. You may try different ways in nginx: you need to build it<br>
&gt; &gt;<br>
&gt; &gt; &nbsp; &nbsp; &nbsp; &nbsp;--with-rtsig_module<br>
&gt; &gt; &nbsp; &nbsp; &nbsp; &nbsp;--with-select_module<br>
&gt; &gt; &nbsp; &nbsp; &nbsp; &nbsp;--with-poll_module<br>
&gt; &gt;<br>
&gt; &gt; and then choose method:<br>
&gt; &gt;<br>
&gt; &gt; events {<br>
&gt; &gt; &nbsp; &nbsp; use &nbsp;select;<br>
&gt; &gt; &nbsp; &nbsp; #use &nbsp;poll;<br>
&gt; &gt; &nbsp; &nbsp; #use &nbsp;rtsig;<br>
&gt; &gt; }<br>
&gt; &gt;<br>
&gt; &gt; Also, epoll has two modes: level triggered (default) and edge<br>
&gt; &gt; triggered (EPOLLET). nginx uses more effective edge triggered mode,<br>
&gt; &gt; lighttpd uses level triggered one. The bug may be in ET mode only.<br>
&gt; &gt;<br>
&gt; &gt; As to probabilty of kernel bugs: I saw them in FreeBSD (kqueue, sendfile),<br>
&gt; &gt; Linux (epoll), Solaris (event ports), and MacOSX (kqueue, sendfile).<br>
&gt; &gt;<br>
&gt; &gt; &gt; Can I do anything to confirm that it&#39;s a kernel bug? If it is, I should<br>
&gt; &gt; &gt; probably contact CentOS&#39;s maintainers.<br>
&gt; &gt;<br>
&gt; &gt; Your straces confirms this: nginx added socket to epoll and did not<br>
&gt; &gt; deleted it, nevertheless epoll does not send event.<br>
&gt; &gt;<br>
&gt; &gt; &gt; Thank you, again.<br>
&gt; &gt; &gt; Yo&#39;av.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; On Wed, Jan 21, 2009 at 7:26 AM, Igor Sysoev &lt;<a href="mailto:is@rambler-co.ru">is@rambler-co.ru</a>&gt; wrote:<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; On Wed, Jan 21, 2009 at 01:52:53AM +0200, Yo&#39;av Moshe wrote:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Igor, here&#39;s the new strace.<br>
&gt; &gt; &gt; &gt; &gt; <a href="http://pastebin.com/m5129c54b" target="_blank">http://pastebin.com/m5129c54b</a><br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Does the fact it works in low download rates still makes you think<br>
&gt; &gt; it&#39;s a<br>
&gt; &gt; &gt; &gt; &gt; kernel issue?<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; Yes, this is seems like a kernel issue. Kernel excatly said (with<br>
&gt; &gt; EAGAIN)<br>
&gt; &gt; &gt; &gt; that there is no place to output data, but never returned a new<br>
&gt; &gt; &gt; &gt; notification<br>
&gt; &gt; &gt; &gt; via epoll_wait() about free space:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; 21420 01:39:43 &lt;... epoll_wait resumed&gt; {{EPOLLOUT, {u32=153137960,<br>
&gt; &gt; &gt; &gt; u64=13811628390360331048}}}, 512, 60000) = 1<br>
&gt; &gt; &gt; &gt; 21420 01:39:43 gettimeofday({1232494783, 413764}, NULL) = 0<br>
&gt; &gt; &gt; &gt; 21420 01:39:43 sendfile64(20, 21, [1645625], 304605) = 40320<br>
&gt; &gt; &gt; &gt; 21420 01:39:43 sendfile64(20, 21, [1685945], 264285) = -1 EAGAIN<br>
&gt; &gt; (Resource<br>
&gt; &gt; &gt; &gt; temporarily unavailable)<br>
&gt; &gt; &gt; &gt; 21420 01:39:43 epoll_wait(11, &nbsp;&lt;unfinished ...&gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; This is probably some race condition inside kernel, that does not<br>
&gt; &gt; appear on<br>
&gt; &gt; &gt; &gt; low speed download.<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Thank you, really!<br>
&gt; &gt; &gt; &gt; &gt; And thanks, Kiril and Jeff, for confirming that!<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; Yo&#39;av.<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; On Tue, Jan 20, 2009 at 9:39 PM, Kiril Angov &lt;<a href="mailto:kupokomapa@gmail.com">kupokomapa@gmail.com</a>&gt;<br>
&gt; &gt; &gt; &gt; wrote:<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; wget <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; --2009-01-20 21:36:00--<br>
&gt; &gt; &gt; &gt; <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; Resolving www.noal.org.il... 195.28.180.147<br>
&gt; &gt; &gt; &gt; &gt; &gt; Connecting to <a href="http://www.noal.org.il" target="_blank">www.noal.org.il</a>|195.28.180.147|:80... connected.<br>
&gt; &gt; &gt; &gt; &gt; &gt; HTTP request sent, awaiting response... 200 OK<br>
&gt; &gt; &gt; &gt; &gt; &gt; Length: 1950230 (1.9M) [application/pdf]<br>
&gt; &gt; &gt; &gt; &gt; &gt; Saving to: `barvazi2.pdf&#39;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; 81% [=====================================&gt; &nbsp; &nbsp; &nbsp; &nbsp; ] 1,596,665<br>
&gt; &gt; &gt; &gt; &gt; &gt; --.-K/s &nbsp;eta 5s<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; wget -c <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; --2009-01-20 21:38:28--<br>
&gt; &gt; &gt; &gt; &gt; &gt; <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; Resolving www.noal.org.il... 195.28.180.147<br>
&gt; &gt; &gt; &gt; &gt; &gt; Connecting to <a href="http://www.noal.org.il" target="_blank">www.noal.org.il</a>|195.28.180.147|:80... connected.<br>
&gt; &gt; &gt; &gt; &gt; &gt; HTTP request sent, awaiting response... 206 Partial Content<br>
&gt; &gt; &gt; &gt; &gt; &gt; Length: 1950230 (1.9M), 305960 (299K) remaining [application/pdf]<br>
&gt; &gt; &gt; &gt; &gt; &gt; Saving to: `barvazi2.pdf&#39;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; 100%[+++++++++++++++++++++++++++++++++++++++=======&gt;] 1,950,230<br>
&gt; &gt; &gt; &gt; &gt; &gt; 295K/s &nbsp; in 1.0s<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; 2009-01-20 21:38:30 (295 KB/s) - `barvazi2.pdf&#39; saved<br>
&gt; &gt; [1950230/1950230]<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; On Tue, Jan 20, 2009 at 9:31 PM, jeff emminger &lt;<br>
&gt; &gt; <a href="mailto:jemminger@gmail.com">jemminger@gmail.com</a>&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; wrote:<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;&gt; Could anyone confirm that this works:<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;&gt; wget --limit-rate=3500<br>
&gt; &gt; &gt; &gt; <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;&gt; while this doesn&#39;t:<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;&gt; wget <a href="http://www.noal.org.il/static/temp/barvazi2.pdf" target="_blank">http://www.noal.org.il/static/temp/barvazi2.pdf</a><br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt; Confirmed<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; &gt; --<br>
&gt; &gt; &gt; &gt; &gt; Yo&#39;av Moshe<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt; --<br>
&gt; &gt; &gt; &gt; Igor Sysoev<br>
&gt; &gt; &gt; &gt; <a href="http://sysoev.ru/en/" target="_blank">http://sysoev.ru/en/</a><br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; --<br>
&gt; &gt; &gt; Yo&#39;av Moshe<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; Igor Sysoev<br>
&gt; &gt; <a href="http://sysoev.ru/en/" target="_blank">http://sysoev.ru/en/</a><br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Yo&#39;av Moshe<br>
<br>
</div></div>--<br>
<div><div></div><div class="Wj3C7c">Igor Sysoev<br>
<a href="http://sysoev.ru/en/" target="_blank">http://sysoev.ru/en/</a><br>
<br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Yo&#39;av Moshe<br>
</div>