<p>In the initial description you talk about "unicode". Unicode characters can be saved using different encodings, this can be UTF-8, UTF-16 and so on. We cannot know which encoding the filename of a file on disk was used.</p>

<p>Yes, we can assume UTF-16 or we can assume UTF-8, maybe even both by trying.<br>
But then the next user wants UTF-32 BE, then UTF-32 LE and whatever else.</p>

<p>The behaviour is probably very similar on non-Windows platforms. I think usually filenames should follow the system's locale. Mixed charsets are never a good idea.</p>

<p>Anyway, I don't know how I could create a file on Windows with a filename not in the system's locale and so cannot really test it. I just tested your changes with non-ASCII filenames in the system's locale and it still works.</p>

<p>Before this could get merged, two remarks:</p>

<ul>
<li>could you try to handle argv[0] as well as mentioned above</li>
<li>it'd be nice if you could move the Windows specific code into a new function in src/win32.c, then src/main.c gets less cluttered. Usually we try to have the weird Windows-specific <del>hidden</del>abstracted in src/win32.c :)</li>
</ul>

<p style="font-size:small;-webkit-text-size-adjust:none;color:#666;">—<br />You are receiving this because you are subscribed to this thread.<br />Reply to this email directly, <a href="https://github.com/geany/geany/pull/1258#issuecomment-255880669">view it on GitHub</a>, or <a href="https://github.com/notifications/unsubscribe-auth/ABDrJ68_LyD4ahGoEra34g7AzLrcOYdlks5q3SxrgaJpZM4KPpLl">mute the thread</a>.<img alt="" height="1" src="https://github.com/notifications/beacon/ABDrJ9rcV_ySHJXSwkhjWCDHWcbKoQDxks5q3SxrgaJpZM4KPpLl.gif" width="1" /></p>
<div itemscope itemtype="http://schema.org/EmailMessage">
<div itemprop="action" itemscope itemtype="http://schema.org/ViewAction">
  <link itemprop="url" href="https://github.com/geany/geany/pull/1258#issuecomment-255880669"></link>
  <meta itemprop="name" content="View Pull Request"></meta>
</div>
<meta itemprop="description" content="View this Pull Request on GitHub"></meta>
</div>

<script type="application/json" data-scope="inboxmarkup">{"api_version":"1.0","publisher":{"api_key":"05dde50f1d1a384dd78767c55493e4bb","name":"GitHub"},"entity":{"external_key":"github/geany/geany","title":"geany/geany","subtitle":"GitHub repository","main_image_url":"https://cloud.githubusercontent.com/assets/143418/17495839/a5054eac-5d88-11e6-95fc-7290892c7bb5.png","avatar_image_url":"https://cloud.githubusercontent.com/assets/143418/15842166/7c72db34-2c0b-11e6-9aed-b52498112777.png","action":{"name":"Open in GitHub","url":"https://github.com/geany/geany"}},"updates":{"snippets":[{"icon":"PERSON","message":"@eht16 in #1258: In the initial description you talk about \"unicode\". Unicode characters can be saved using different encodings, this can be UTF-8, UTF-16 and so on. We cannot know which encoding the filename of a file on disk was used.\r\n\r\nYes, we can assume UTF-16 or we can assume UTF-8, maybe even both by trying.\r\nBut then the next user wants UTF-32 BE, then UTF-32 LE and whatever else.\r\n\r\nThe behaviour is probably very similar on non-Windows platforms. I think usually filenames should follow the system's locale. Mixed charsets are never a good idea.\r\n\r\nAnyway, I don't know how I could create a file on Windows with a filename not in the system's locale and so cannot really test it. I just tested your changes with non-ASCII filenames in the system's locale and it still works.\r\n\r\nBefore this could get merged, two remarks:\r\n- could you try to handle argv[0] as well as mentioned above\r\n- it'd be nice if you could move the Windows specific code into a new function in src/win32.c, then src/main.c gets less cluttered. Usually we try to have the weird Windows-specific ~~hidden~~abstracted in src/win32.c :)"}],"action":{"name":"View Pull Request","url":"https://github.com/geany/geany/pull/1258#issuecomment-255880669"}}}</script>